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(57) Abstract 



The present invention relates to regulatory DNA sequences containing promoter sequences, in addition to intervening sequences, for 
the human catalytic telomerase sub-unit gene. The invention also relates to the use of said DNA sequences for pharmaceutical, diagnostic 
and therapeutic purposes, especially in the treatment of cancer and ageing. 



(57) Z usammen fassung 

Dicsc Erfindung betrifft regulatorische DNA-Sequenzen, beinhaltend Promotorsequenzen, sowie Intronscqucnzcn, fQr das Gen der 
humanen kalytischen Telomerasc-Untereinheit Dariiber hinaus betrifft diese Erfindung die Verwendung dieser DNA-Sequenzen fCh* 
pharmazeutische, diagnostische und therapeutische Zwecke, vor allem in der Behandlung von Krebs und Alterung. 
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Regulatorische DNA-Sequenzen des Gens der humanen katalytischen 
Telomerase-Untereinheit und deren diagnostische und therapeutische Verwen- 
dung 

5 Aufbau und Funktion der Chromosomenenden 

Das genetische Material eukaryontischer Zellen ist auf linearen Chromosomen 
verteilt Die Enden der Erbanlagen werden, abgeleitet von den griechischen Wfirtern 
telos (Ende) und meros (Teil, Segment), als Telomere bezeichnet. Die meisten 
10 Telomere bestehen aus Wiederhoiungen von kurzen Sequenzen, die iiberwiegend aus 
Thymin und Guanin aufgebaut sind (Zakian, 1995). In alien bislang untersuchten 
Wirbeltieren werden die Telomere aus der Sequenz TTAGGG aufgebaut (Meyne et 
al y 1989). 

1 5 Die Telomere uben verschiedene wichtige Funktionen aus. Sie verhindern die Fusion 
von Chromosomen (McClintock, 1941) und damit die Entstehung von dizentrischen 
Erbanlagen. Solche Chromosomen mit zvvei Centromeren konnen durch Veriust der 
Heterozygotie bzw. Verdopplung oder Veriust von Genen zur Entwicklung von 
Krebs fuhren. 

20 

Desweiteren dienen Telomere dazu, intakte Erbanlagen von beschadigten zu unter- 
scheiden. So stellten Hefezellen ihre Zellteilung ein, wenn sie ein Chromosom ohne 
Telomer enthielten (Sandell und Zakian, 1993). 

25 Eine weitere wichtige Aufgabe erfiillen Telomere bei der DNA-Replikation 
eukaryontischer Zellen. Im Gegensatz zu den zirkularen Genomen von Prokaryonten 
k6nnen die linearen Chromosomen der Eukaryonten von dem DNA Polymerase- 
Komplex nicht vollstandig repliziert werden. Zur Initiation der DNA-Replikation 
sind RNA-Primer notwendig. Nach Abspaltung der RNA-Primer, Verl&ngerung der 

30 Okazaki-Fragmente und anschlieBender Ligation fehlt dem neu-synthetisierten DNA- 
Strang das 5'-Ende, denn doit kann der RNA-Primer nicht durch DNA ersetzt 
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werden. Ohne besondere Schutzmechanismen wilrden daher die Chromosomen mit 
jeder Zellteilung schrumpfen ("end-replication problem"; Harley et al, 1990). Die 
nicht-kodierenden Telomersequenzen stellen vermutlich eine PufFerzone dar, um 
dem Verlust von Genen vorzubeugen (Sandell und Zakian, 1993), 

Dariiberhinaus spielen Telomere auch eine wichtige Rolle bei der Regulation der zel- 
lul&ren Alterung (Olovnikov, 1973). Humane somatische Zellen zeigen in Kultur 
eine limitierte Replikationskapazitat; sie werden nach einer gewissen Zeit seneszent. 
In diesem Zustand teilen sich die Zellen selbst nach Stimulierung mit Wachstumsfak- 
toren nicht mehr, sterben aber nicht, sondern bleiben metabolisch aktiv (Goldstein, 
1990). Verschiedene Beobachtungen sprechen fur die Hypothese, dafi eine Zelle an- 
hand der Lange ihrer Telomere bestimmt, wie oft sie sich noch teilen kann (Allsopp 
et a/., 1992). 

Zusammenfassend besitzen die Telomere somit zentrale Funktionen bei der Alterung 
von Zellen sowie der Stabilisierung des genetischen Materials und Verhinderung von 
Krebs. 

Das Enzym Telomerase synthetisiert die Telomere 

Wie oben beschrieben konnen Organismen mit linearen Chromosomen ohne einen 
spezieilen Schutzmechanismus ihr Genom nur unvollst&ndig replizieren. Die meisten 
Eukaryonten verwenden zur Regeneration der Telomersequenzen ein spezielles En- 
zym, die Telomerase. In den bislang untersuchten Einzellern wird Telomerase konsti- 
tutiv exprimiert. Dagegen wurde in Menschen die Telomerase-Aktivitat nur in Keim- 
zellen und Tumorzellen gemessen, wogegen benachbartes somatisches Gewebe keine 
Telomerase enthielt (Kim et ai, 1994). 

Funktionell kann die Telomerase auch als terminale Telomertransferase bezeichnet 
werden, die als Multiproteinkomplex im Zellkern lokalisiert ist. Wahrend der RNA- 
Anteil der humanen Telomerase schon seit langerem bekannt ist (Feng et a/., 1995), 
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wurde kiirzlich die katalytische Untereinheit dieser Enzymgruppe in verschiedenen 
Organismen identifiziert (Lingner et al % 1997; vgl. unsere ebenfalls anhingige 
Anmeldung PCT EP/98/03468). Diese katalytischen Untereinheiten der Telomerase 
sind sowohl untereinander als auch zu bisher alien bekannten reversen Transkriptasen 
5 auffiillig homolog, 

Auch in WO 98/14592 werden Nukleinsaure- und Aminosauresequenzen der 
katalytischen Telomerase-Untereinheit beschrieben. 

10 Aktivierung der Telomerase in menschlichen Tumoren 

Eine Aktivitat der Telomerase konnte in Menschen ursprunglich nur in Keimbahnzel- 
len, nicht aber in normalen somatischen Zellen (Hastie et al. y 1990; Kim et aL, 1994) 
nachgewiesen werden. Nach der Entwicklung eines sensitiveren Nachweisverfahrens 

15 (Kim et a/., 1994) wurde auch in hematopoietischen Zellen eine geringe Telomerase- 
aktivitat detektiert (Broccoli et ai, 1995; Counter et a/., 1995; Hiyama et a/., 1995). 
Allerdings wiesen diese Zellen trotzdem eine Reduktion der Telomere auf (Vaziri et 
ai, 1994; Counter et a/., 1995). Noch ist nicht geklart, ob die Menge an Enzym in 
diesen Zellen nicht ausreichend filr eine Kompensation des Telomerverlustes ist, oder 

20 ob die gemessene Telomerase-Aktivitat von einer Subpopulation, z.B. unvollstandig 
ausdifferenzierten CD34 + 38+-Vorlauferzellen, herriihrt (Hiyama et ai, 1995). Zur 
Klarung ware ein Nachweis der Telomerase-Aktivitat in einer einzelnen Zelle notig. 

Interessanterweise wurde jedoch in einer grofien Zahl der bislang getesteten Tumor- 
25 gewebe eine signifikante Telomerase-Aktivitat nachgewiesen (1734/2031, 85 %; 
Shay, 1997), wahrend in normalem somatischen Gewebe keine Aktivitat gefunden 
wurde (1/196, <1 %, Shay, 1997). Verschiedene Untersuchungen zeigten auflerdem, 
dafl in seneszenten Zellen, die mit viralen Oncoproteinen transformiert wurden, die 
Telomere weiterhin schrumpften und Telomerase nur in der Subpopulation entdeckt 
30 werden konnte, die die Wachstumskrise iiberlebte (Counter et ai 9 1992). In diesen 
immortalisierten Zellen waren auch die Telomere stabil (Counter et al. t 1992). Ahnli- 
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che Befunde aus Untersuchungen an Mausen (Blasco et dl, 1996) stUtzen die An- 
nahme, dafl eine Reaktivierung der Telomerase ein spates Ereignis in der Tumorge- 
nese ist. 

5 Basierend auf diesen Ergebnissen wurde eine "Telomerase-Hypothese" entwickelt, 
die den Verlust von Telomersequenzen und Zellalterung mit der Aktivitat von 
Telomerase und der Entstehung von Krebs verbindet. In langlebigen Spezies wie 
dem Menschen kann das Schrumpfen der Telomere als ein Mechanismus zur Tumor- 
suppression angesehen werden. Ausdifferenzierte Zellen, die keine Telomerase 

10 enthalten, stellen bei einer bestimmten Lange der Telomere ihre Zellteilung ein. 
Mutiert eine solche Zelle, so kann aus ihr nur dann ein Tumor entstehen, wenn die 
Zelle ihre Telomere veriangem kann. Ansonsten vviirde die Zelle weiterhin Telomer- 
sequenzen verlieren, bis ihre Chromosomen instabil werden und sie schlieBlich zu- 
grunde geht. Die Reaktivierung der Telomerase ist vermutiich der Hauptmechanis- 

1 5 mus von Tumorzellen zur Stabilisation ihrer Telomere. 

Aus diesen Beobachtungen und Uberlegungen ergibt sich, daB eine Inhibition der Te- 
lomerase eine Therapie von Tumoren erlauben sollte. Konventionelle Krebstherapien 
mit Zytostatika oder kurzwelligen Strahlen schadigen nicht nur die Tumorzellen, 

20 sondern alle sich teilenden Zellen des Korpers. Da aber auBer Tumorzellen nur 
Keimbahnzellen eine signifikante Telomerase-Aktivitat enthalten. wurden Telome- 
rase-Inhibitoren spezifischer die Tumorzellen angreifen und somit weniger uner- 
vvunschte Nebenwirkungen hervorrufen. In alien bislang getesteten Tumorgeweben 
wurde eine Telomerase-Aktivitat nachgewiesen, so daB diese Therapeutika gegen alle 

25 Krebsarten eingesetzt werden kbnnten. Die Wirkung von Telomerase-Inhibitoren 
wiirde dann eintreten, wenn die Telomere der Zellen sich soweit verkiirzt haben, daB 
das Genom instabil wird. Da Tumorzellen meist kiirzere Telomere aufweisen als 
normale somatische Zellen, wtirden zuerst Krebszellen durch Telomerase-Inhibitoren 
eliminiert werden. Zellen mit langen Telomeren, wie die Keimzellen, wurden 

30 dagegen erst viel spater geschadigt werden. Telomerase-Inhibitoren stellen somit 
einen zukunftsweisenden Weg fur die Therapierung von Krebs dar. 
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Eindeutige Antworten auf die Frage nach der Art und den Angriffspunkten physiolo- 
gischer Telomerase-Inhibitoren werden mfiglich sein, wenn auch die Regulation der 
Genexpression der Telomerase identifiziert ist. 

5 

Regulation der Genexpression in Eukaryonten 

Die eukaryotische Genexpression, d.h. der zellulare InformationsfluB von der DNA 
uber die RNA zum Protein, weist vielf&ltige Ansatzpunkte fur regulatorische Mecha- 
10 nismen auf. Einzeine Kontrollstufen sind z.B. die Gen- Amplification, Rekombina- 
tion von Genloci, Cluomatinstruktur, DNA-Methylierung, Transkription, posttrans- 
kriptioneile mRNA-Modifikationen, mRNA-Transport, Translation und post-trans- 
Iationale Proteinmodifikationen. Nach bisherigen Studien besitzt die Kontrolle auf 
der Ebene der Transkriptionsinitiation die groflte Bedeutung (Latchman, 1991). 

15 

Unmittelbar stromaufwarts vom Transkriptionsstart eines von der RNA-Polymerase 
II transkribierten Gens liegt eine Region, die fur die Steuerung der Transkription ver- 
antwortlich ist und als Promotorregion bezeichnet wird. Ein Vergleich der Nukleo- 
tidsequenzen von Promotorregionen vieler bekannter Gene zeigt. dafl bestimmte 

20 Sequenzmotive in dieser Region haufig vorkommen. Zu diesen Elementen gehoren 
unter anderem die TATA-Box, die CCAAT-Box und die GC-Box, die von spezifi- 
schen Proteinen erkannt werden. Die TATA-Box, die etwa 30 Nukleotide stromauf- 
wSrts vom Transkriptionsstart entfernt positioniert ist, wird z.B. von der TFIID- 
Untereinheit TBP („TATA-box binding protein") erkannt, vvogegen bestimmte GC- 

25 reiche Sequenzabschnitte vom Transkriptionsfaktor Spl (^specificity protein 1") spe- 
zifisch gebunden werden. 

Funktionell kann man den Promoter in einen regulativen und einen konstitutiven Ab- 
schnitt unterteilen (Latchman, 1991). Der konstitutive Kontrollbereich umfaBt den 
30 sogenannten Kernpromotor („corepromoter"), der die korrekte Initiation der Trans- 
kription ermoglicht. Er enthait die als UPE's (upstream promoter elements") be- 
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schriebenen Sequenzelemente, die fUr eine effiziente Transkription notwendig sind. 
Die regulativen Kontrollabschnitte, die mit den UPE's verflochten sein kOnnen, 
weisen Sequenzelemente auf, die an der signalabhSngigen Regulation der Trans- 
kription durch Hormone, Wachstumsfaktoren usw. beteiligt sein konnen. Sie ver- 
5 mitteln gewebs- oder zellspezifische Promotoreigenschaften. 

Ein charakteristisches Merkmal eukaryotischer Gene sind DNA-Abschnitte, die iiber 
vergleichsweise grofle Distanzen hinweg Einflufl auf die Genexpression nehmen k6n- 
nen. Diese Elemente konnen stromaufwarts, stromabwSrts oder innerhalb einer 
10 Transkriptionseinheit lokalisiert sein und unabhSngig von ihrer Orientierung ihre 
Funktion wahmehmen. Diese Sequenzabschnitte konnen die Promotoraktivitat ver- 
starken (Enhancer) oder abschwachen (Silencer). Ahnlich wie die Promotorregionen 
beherbergen auch Enhancer und Silencer mehrere Bindungsstellen fur Transkrip- 
tionsfaktoren. 

15 

Die Erfindung betrifft die DNA-Sequenzen aus der 5'-flankierenden Region des 
Gens der kataiytisch aktiven humanen Telomerase-Untereinheit sowie Intron- 
Sequenzen fur dieses Gen. 

20 Die Erfindung betrifft insbesondere die 5'-flankierende regulatorische DNA- 
Sequenz, enthaltend die Promotor-DNA-Sequenz fur das Gen der humanen 
katalytischen Telomerase Untereinheit gemafi Fig. 10 (SEQ ID NO 3). 

Die Erfindung betrifft weiterhin regulatorisch wirksame Teilbereiche der S'-flankie- 
25 renden regulatorischen DNA-Sequenz gemafi Fig. 4 (SEQ ID NO 1 ). 

Weiterhin sind Gegenstand der vorliegenden Erfindung Intron-Sequenzen fur das 
Gen der humanen katalytischen Telomerase-Untereinheit, insbesondere solche, die 
regulatorische Wirkung haben. Die erfindungsgemaflen Intronsequenzen werden im 
30 Rahmen von Beispiel 5 detailliert beschrieben (vgl. SEQ ID NO 4, 5, 6, 7, 8, 9, 10, 
11, 12, 13, 14, 15, 16, 17, 18, 19 und 20). 
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Die Erfindung betrifft weiterhin ein rekombinantes Konstrukt, das die erfindungsge- 
mafien DNA-Sequenzen, insbesondere die 5'-flankierende DNA-Sequenz des Gens 
der humanen katalytischen Teiomerase Untereinheit oder Teilbereiche davon 
5 beinhaltet. 

Bevorzugt sind rekombinante Konstrukte, die neben den erfindungsgemaBen DNA- 
Sequenzen, insbesondere der 5'-flankierenden DNA-Sequenz des Gens der humanen 
katalytischen Teiomerase Untereinheit oder Teilbereichen davon, eine oder mehrere 
1 0 weitere DNA-Sequenzen, die fur Polypeptide oder Proteine kodieren, enthalten. 

GemaB einer besonders bevorzugten Ausfuhrungsform kodieren diese weiteren 
DNA-Sequenzen fiir antitumorale Proteine. 

15 Besonders bevorzugte antitumorale Proteine sind solche, die die Angiogenese direkt 
oder indirekt inhibieren. Zu diesen Proteinen zahlen beispielsweise: 

Plasminogenaktivatorinhibitor (PAI-1), PAI-2, PAI-3, Angiostatin, Endostatin, 
Platelet factor 4, TIMP-1, TIMP-2, TIMP-3, Leukemia Inhibitory Factor (LIF). 

20 

Ebenfalls besonders bevorzugt sind antitumorale Proteine, welche direkt oder 
indirekt eine zytostatische Wirkung auf Tumoren aufweisen. Hierzu zahlen im 
besonderen: 

25 Perforin, Granzym, IL-2, IL-4, IL-12, Interferone, wie beispielsweise IFN-ct, IFN-fl, 
IFN-y,TNF, TNF-a, TNF-B, Oncostatin M; Tumorsuppressorgene, wie z.B. p53, 
Retinoblastoma. 



30 



Weiterhin besonders bevorzugt sind antitumorale Proteine, welche gegebenenfalls 
zusatzlich zur antitumoralen Wirkung EntzUndungen stimulieren und hierdurch zur 
Elimination von Tumorzellen beitragen. Hierzu zahlen beispielsweise: 
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RANTES, Monocyte chemotactic and activating factor (MCAF), IL-8, Macrophage 
inflammatory protein (MIP-la,-B), Neutrophil activating protein-2 (NAP-2), IL-3, 
IL-5, human leukemia inhibitory factor (LIF), IL-7, IL-ll, IL-13, GM-CSF, G-CSF, 
M-CSF. 

Weiterhin besonders bevorzugt sind antitumorale Proteine, welche aufgrund ihrer 
Wirkung als Enzyme in der Lage sind, Vorstufen eines antitumoralen Wirkstoffes in 
einen antitumoralen Wirkstoff zu uberflihren. Zu diesen Enzymen zShlen beispiels- 
weise: 

Herpes Simplex Virus Thymidinkinase, Varizella Zoster Virus Thymidinkinase, bak- 
terielie Nitroreductase, bakterielle B- Glukuronidase, pflanzliche B-Glukuronidase 
aus Secale careale, humane Glukuronidase, humane Carboxypeptidase, bakterielle 
Carboxypeptidase, bakterielle fi-Lactamase, bakterielle Cytosindeaminidase, humane 
Katalase bzw. Phosphatase, humane alkalische Phosphatase, Typ 5 saure Phospha- 
tase, humane Lysooxidase, humane saure D-Aminooxidase, humane Glutathion 
Peroxidase, humane Eosinophilen Peroxidase, humane Schilddriisen Peroxidase. 

Die obengenannten rekombinanten Konstrukte konnen auch DNA-Sequenzen enthal- 
ten, die flir Faktor VIII, IX oder Teilfragmente davon kodieren. Zu diesen DNA- 
Sequenzen zahlen auch andere Blutgerinnungsfaktoren 

Die obengenannten rekombinanten Konstrukte konnen auch DNA-Sequenzen enthal- 
ten, die fUr ein Reporterprotein kodieren. Zu diesen Reporterproteinen zalilen bei- 
spielsweise: 

Chloramphenicolacetyltransferase (CAT), Gliihwurmchen Luziferase (LUC), B- 
Galaktosidase (B-Gal) f Sezemierte alkalische Phosphatase (SEAP), Humanes 
Wachstumshormon (hGH), B-Glukuronidase (GUS), Griln-fluoreszierendes Protein 
(GFP) und alle davon abgeleiteten Varianten, Aquarin, Obelin. 
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Erfindungsgem&Be rekombinante Konstrukte konnen auch DNA kodierend fur die 
humane katalytische Telomerase Untereinheit und deren Varianten und Fragmente in 
antisense Orientierung enthalten. Gegebenenfalls konnen diese Konstrukte auch 
5 andere Protein-Untereinheiten der humanen Telomerase und die Telomerase-RNA- 
Komponente in antisense Orientierung enthalten. 

Die rekombinanten Konstrukte kfinnen neben der DNA, kodierend ftir die humane 
katalytische Telomerase Untereinheit, sowie deren Varianten und Fragmente auch 
10 andere Protein-Untereinheiten der humanen Telomerase und die Telomerase-RNA- 
Komponente enthalten. 

Die Erfindung betrifft weiterhin einen Vektor, enthaltend die oben genannten erfin- 
dungsgemafien DNA-Sequenzen, insbesondere die 5'-flankierenden DNA-Sequen- 
1 5 zen, sowie eine oder mehrere der oben genannten anderen DNA-Sequenzen. 

Bevorzugter Vektor fur solche Konstrukte ist ein Virus, beispielsweise ein Retrovi- 
rus, Adenovirus, adeno-assoziiertes Virus, Herpes Simplex Virus, Vaccina Virus, 
lentivirales Virus, Sindbis Virus und ein Semliki Forest Virus. 

20 

Ebenfalls bevorzugt sind Plasmide als Vektoren. 

Die Erfindung betrifft weiterhin pharmazeutische Praparate, enthaltend erfin- 
dungsgemaBe rekombinante Konstrukte bzw. Vektoren; beispielsweise eine Zube- 
25 reitung in einem kolloidaien Dispersionssystem. 

Geeignete kolloidale Dispersionssysteme sind beispielsweise Liposome oder Polyly- 
sin-Liganden. 

30 Die Zubereitungen der erfindungsgemaflen Konstrukte bzw. Vektoren in kolloidaien 
Dispersionssystemen kbnnen um einen Liganden ergfcnzt sein, der an Membranstruk- 
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turen von Tumorzellen bindet. Ein solcher Ligand kann z.B. an das Konstmkt bzw. 
den Vektor angekndpft sein oder auch Bestandteil der Liposomenstruktur sein. 

Geeignete Liganden sind insbesondere polyklonale oder monoklonale Antikorper 
5 oder Antikorperfragmente hiervon, die mit ihren variablen Domanen an Membran- 
strukturen von Tumorzellen binden, oder endstandige Mannose-tragende Substanzen, 
Zytokine, Wachstumsfaktoren oder Fragmente bzw. Teilsequenzen hiervon, die an 
Rezeptoren auf Tumorzellen binden. 

10 Entsprechende Membranstrukturen sind beispielsweise Rezeptoren ftir ein Zytokin 
oder einen Wachstumsfaktor, wie z.B. IL-l, EGF, PDGF, VEGF, TGF B, Insulin 
oder Insulin-like Growth Factor (ILGF), oder Adhasionsmolekule, wie z. B. SLeX, 
LFA-1, MAC- 1, LECAM-1 oder VLA-4, oder der Mannose-6-Phosphat-Rezeptor. 

15 Zur vorliegenden Erfindung gehdren pharmazeutische Zubereitungen, die neben den 
erfindungsgemafien Vektorkonstrukten auch nichttoxische, inerte, pharmazeutisch 
geeignete Tragerstoffe enthalten konnen. Vorstellbar sind die Applikation (z.B. intra- 
venos, intraarteriell, intramuskular, subkutan, intradermal, anal, vaginal, nasal, trans- 
dermal, intraperitonal, als Aerosol oder oral) am Ort eines Tumors oder die syste- 

20 mische Applikation dieser Zubereitungen. 

Die erflndungsgemaBen Vektorkonstrukte kOnnen in der Gentherapie eingesetzt wer- 
den. 

25 Die Erfindung betrifft weiterhin eine rekombinante Wirtszelle, insbesondere eine 
rekombinante eukaryotische Wirtszelle, enthaltend die vorstehend beschriebenen 
Konstrukte bzw. Vektoren. 

Die Erfindung betrifft weiterhin ein Verfahren zur Identifizierung von Substanzen, 
30 die die Promotor-, Silencer- oder Enhanceraktivitat der katalytischen Telomerase 
Untereinheit beeinflussen, wobei dieses Verfahren folgende Schritte umfafit: 
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A. Zugabe einer Kandidatensubstanz zu einer Wirtszelle, enthaltend die 
erfindungsgemaBe regulatorische DNA-Sequenz, insbesondere die 5'-flankie- 
rende regulatorische DNA-Sequenz fur das Gen der humanen katalytischen 

5 Telomerase-Untereinheit oder einen regulatorisch wirksamen Teilbereich 

davon, fiinktionell verknQpft mit einem Reportergen, 

B. Messung des SubstanzefFektes auf die Reportergenexpression. 

10 Das Verfahren kann eingesetzt werden zur Identifizierung von Substanzen, die die 
Promotor-, Silencer- oder Enhanceraktivitat der katalytischen Telomerase Unterein- 
heit verstarken. 

Das Verfahren kann weiterhin eingesetzt werden zur Identifizierung von Substanzen, 
15 die die Promotor-, Silencer- oder Enhanceraktivit&t der katalytischen Telomerase 
Untereinheit inhibieren. 

Die Erfindung betrifft weiterhin ein Verfahren zur Identifizierung von Faktoren, die 
spezifisch an Fragmente der erfindungsgem&Ben DNA-Fragmente, insbesondere der 
20 5'-flankierenden regulatorischen DNA-Sequenz der katalytischen Telomerase 
Untereinheit, binden. Diese Methode beinhaltet ein Screening einer Expressions- 
cDNA-Bibliothek mit der vorstehend beschriebenen DNA-Sequenz oder Teilfrag- 
menten unterschiedlichster Lange als Sonde. 

25 Die vorstehend beschriebenen Konstrukte bzw, Vektoren kGnnen auch zur Her- 
stellung transgener Tiere verwendet werden. 

Die Erfindung betrifft weiterhin ein Verfahren zur Detektion Telomerase-assoziierter 
Zustande bei einem Patienten, das folgende Schritte umfaBt: 
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A. Inkubation eines Konstruktes bzw. Vektors, enthaltend die erfrndungsgemSBe 
DNA-Sequenz, insbesondere die S'-flankierende regulatorische DNA- 
Sequenz fiir das Gen der humanen katalytischen Telomerase-Untereinheit 
oder einen regulatorisch wirksamen Teilbereich davon sowie ein Reportergen 
mit KSrperfliissigkeiten oder zelluiaren Proben, 

B. Detektion der Reportergenaktivitat, um einen diagnostischen Wert zu 
erhalten; 

C. Vergleich des diagnostischen Werts mit Standardwerten fUr das Reportergen- 
konstrukt in standardisierten normalen Zellen oder Korperflussigkeiten des 
gleichen Typs wie die Testprobe; 

Detektion diagnostischer Werte, die hiJher oder niedriger als Standardvergleichswerte 
liegen, indiziert einen Telomerase-assoziierten Zustand, der wiederum einen pathoge- 
nen Zustand indiziert. 

Erlauterung der Abbiidungen: 

Fig. 1 : Southern Blot-Analyse mit genomischer DN A verschiedener Spezies 

A: Foto eines Ethidiumbromid gefarbten 0,7 %igen Agarosegels mit etwa 
4 \ig Eco RI geschnittener genomischer DNA. Die Spur 1 enthalt Hind III 
geschnittene X-DNA als Grfiiienmarker (23,5, 9,4, 6,7, 4,4, 2,3, 2,0, und 
0,6 kb). Die Spuren 2 bis 10 enthalten genomische DNA von Mensch, 
Rhesusaffe, Spraque Dawley Ratte, BALB/c Maus, Hund, Rind, 
Kaninchen, Huhn und Hefe {Saccharomyces cerevisiae). 

B; Zu Fig.l A korrespondierendes Autoradiogramm einer Southern Blot- 
Analyse, hybridisiert mit einer radioaktiv-markierten etwa 720 bp langen 
hTC-cDNA Sonde. 



WO 99/33998 



PCT/EP98/08216 



13 



Fig. 2: Restriktionsanalyse der rekombinanten X-DNA des Phagenklons P 1 2, der 
mit einer Sonde aus dem 5'-Bereich der hTC-cDNA hybridisiert. 

Die Abbildung zeigt ein Foto eines Ethidiumbromid gefarbten 0,4 %igen 
Agarosegels. Die Spuren 1 und 2 enthalten Eco RI/Hind HI gesclmittene 
X-DNA bzw eine 1 kb Leiter der Firma Gibco als Groflenmarker. Die 
Spuren 3 - 7 enhalten 250 ng mit Bam HI (Spur 3), Eco RI (Spur 4), Sal I 
(Spur 5), Xho I (Spur 6) und Sac I (Spur 7) geschnittene DNA des 
rekombinanten Phagens. Die Pfeile kennzeichnen die zwei X-Arme des 
Vektors EMBL3 Sp6/T7. 

Fig. 3: Restriktionsanalyse und Southern Blot-Analyse der rekombinanten X- 
DNA des Phagenklons, der mit einer Sonde aus dem 5'-Bereich der hTC- 
cDNA hybridisiert. 

A: Die Abbildung zeigt ein Foto eines Ethidiumbromid gefdrbten 
0,8%igen Agarosegels. Die Spuren 1 und 1 5 enthalten eine I kb Leiter 
der Firma Gibco als GroGenmarker. Die Spuren 2 bis 14 enthalten 250 ng 
geschnittene X-DNA vom rekombinanten Phagenklon. Als Enzyme 
wurden eingesetzt: Spur 2: Sac I, Spur 3: Xho I, Spur 4: Xho I, Xba I, 
Spur 5: Sac I, Xho I, Spur 6: Sal I, Xho I, Xba I, Spur 7: Sac I, Xho I, 
Xba I, Spur 8: Sac I, Sal I, Xba I, Spur 9: Sac I, Sal I, BamH I, Spur 10: 
Sac I, Sal I, Xho I, Spur 11: Not I, Spur 12: Sma I, Spur 13: leer, Spur 
14: nicht verdaut. 

B: Zu Fig.3 A korrespondterendes Autoradiogramm einer Southern Blot- 
Analyse. Als Sonde fur die Hybridisierung wurde ein etwa 420 bp ianges 
5'-hTC-cDNA Fragment eingesetzt. 
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Fig. 4: Partielle DNA-Sequenz der 5'-flankierenden Region und des Promotors 
vom Gen der humanen kataiytischen Telomerase-Untereinheit. Das 
ATG-Startcodon ist in der Sequenz fett hervorgehoben. Die dargestelite 
Sequenz entspricht SEQ ID NO 1. 

5 

Fig. 5: Identifizierung des Transkriptionsstarts durch Primer Extension- Analyse. 

Die Abbildung zeigt ein Autoradiogramm eines denaturierenden Poly- 
acrylamidgeis, welches zur Darstellung einer Primer Extension-Analyse 
gew&hlt wurde. Als Primer wurde ein Oligonukleotid mit der Sequenz 
5'GTTAAGTTGTAGCTTACACTGGTTCTC 3' benutzt. In der Spur 1 
wurde die Primer Extension Reaktion aufgetragen. Die Spuren G, A, T, 
C, stellen die Sequenzreaktionen mit dem gleichen Primer und den ent- 
sprechenden Dideoxynukleotiden dar. Der fette Pfeil kennzeichnet den 
Haupt-Transkriptionsstart, die dunnen Pfeile weisen auf drei Neben- 
Transkriptionsstartpunkte hin. 
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Fig, 6: cDNA Sequenz der humanen kataiytischen Telomerase-Untereinheit 
(hTC; vgl. unsere anhangige Anmeldung PCT/EP/98/03468). Die 
20 dargestelite Sequenz entspricht SEQ ID NO 2. 

Fig. 7: Strukturelle Organisation und Restriktionsmappe des humanen hTC- 
Gens und dessen 5'- und 3'-flankierende Region. 

25 Exons sind als durchnummerierte schwarz ausgefullte Rechtecke und 

Introns als nicht ausgefullte Bereiche hervorgehoben. Nichttranslatierte 
Sequenzabschnitte in den Exons sind schraffiert. Die Translation startet 
in Exon I und endet in Exon 16. Restriktionsenzymschnittstellen sind 
wie folgt gekennzeichnet: S, Sad; X, Xhol. Die relative Anordnung der 

30 fiinf Phagenklone (P2, P3, P5, P12, P17) und des Produktes aus dem 

^Genomic walking" sind durch diinne Linien hervorgehoben. Wie durch 
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die Punkte gekennzeichnet, ist die Sequenz von Intron 16 nur teilweise 
entschlQsselt. 

HTL Splicevarianten. 

A: Schematische Struktur der hTC mRNA Splicevarianten. Die voll- 
standige hTC mRNA ist als grau unterlegtes Rechteck im oberen Bereich 
der Abb. dargestellt. Die 16 Exons sind entsprechend ihrer GrGfle 
dargestellt. Der Translationsstart (ATG) und das Stop-Codon, sovvie das 
Telomerase-spezifische T-Motiv und die sieben RT-Motive sind hervor- 
gehoben. Die hTC-Varianten sind in Deletions- und Insertionsvarianten 
unterteilt. In den Deletionen sind die fehlenden Exonsequenzen markiert. 
Die Insertionen sind durch zusStzliche weiBe Rechtecke hervorgehoben. 
GrSBe und Herkunft der insertierten Sequenzen sind angegeben. Neu 
entstandene Stop-Codons sind markiert. Die Grofie der Insertion von 
Variante INS2 ist unbekannt. 

B: Exon Intron Ubergange der hTC-Splice-Varianten. Nichtgesplicte 5'- 
und 3'-flankierte Sequenzen sind als weiDe Rechtecke hervorgehoben. 
Die Herkunft der Exon und Intron Sequenzen ist angegeben. Intron und 
Exon Sequenzen sind in Kleinbuchstaben, bzw. in Groflbuchstaben 
dargestellt. Die Donor und Akzeptor Sequenzen der Splicestellen sind als 
graue Rechtecke unterlegt und deren Exon Intron Herkunft ist ebenfalls 
angegeben. 

Identifizierung des Transkriptionsstarts durch RT-PCR Analyse. 
Die RT-PCR wurde mit cDNA-Bibliothek aus HL 60 Zellen und ge- 
nomischer DNA als Positivkontrolle durchgeflihrt. Ein gemeinsamer 3'- 
Primer hybridisiert an eine Sequenzregion aus Exon 1 . Die Position der 
verschiedenen 5' Primer in der kodierenden Region oder der 5'- 
flankierenden Region ist angegeben. In der Negativkontrolle wurde keine 



WO 99/33998 



PCT/EP98/08216 



16 

Template-DNA in der PCR-Reaktion zugegeben. M: DNA-GrdBen- 
marker. 

Fig. 10: Nukleotidsequenz und Strukturmerkmale des hTC-Promotors. 

11273 bp der 5'-flankierenden hTC Gensequenz, beginnend mit dem 
Translationsstartcodon ATG (+1) sind dargestellt. Die putative Region 
des Translationsstarts ist unterstrichen. MSgliche regulatorische Sequenz- 
abschnitte innerhalb der 4000 bp stromaufwarts des Translationsstarts 
sind umrandet. Die dargestellte Sequenz entspricht SEQ ID NO 3. 

Fig. 1 1 : Aktivitat des hTC-Promotors in HEK-293 Zellen. 

Im oberen Bereich der Abbildung sind die ersten 5000 bp der 5'- 
flankierenden hTC Genregion schematisch dargestellt. Das ATG- 
Startcodon ist hervorgehoben. CpG reiche Insein sind durch graue 
Rechtecke markiert. Auf der linken Abbildungsseite sind die GroBen der 
hTC Promotor-Luziferase Konstukte dargestellt. Das pomotorlose pGL2- 
Basic Konstrukt und das SV40 Promotorkonstrukt pGL2-Pro wurden in 
jeder Transfektion als Kontrollen eingesetzt. Auf der rechten Abbil- 
dungsseite sind ist die relative Luziferaseaktivitat der verschiedenen 
Promotorkonstukte in HEK-Zellen als durchgehende Balken gezeigt. Die 
Standardabweichung ist angegeben. Die Zahlenwerte reprasentieren den 
Durchschnitt von zwei unabhangigen Experimented die in Dupiikaten 
durchgefiihrt wurden. 

25 Tab. I : Exon Intron Uberg£nge des hTC-Gens 

Aufgelistet sind die Nukleotidsequenzen an den 3 ' - und 5 ' 
Spliceiibergangen des hTC-Gens. Die Konsensussequenzen fur Donor 
und Akzeptorsequenzen (AG und GT) sind durch graue Rechtecke 
unterlegt. Intronsequenzen (Kleinbuchstaben) und Exonsequenzen (GroB- 

30 buchstaben), die die Spliceakzeptor- und Donorstellen flankieren sind 

gezeigt. Die GrfiBe der Exons und Introns ist in bp angegeben. 
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Tab. 2: Potentielle Bindungsstellen fiir DNA-bindende Faktoren in der 
Nukleotidsequenz von Intron 2 

Die Suche nach mfiglichen DNA-bindenden Faktoren (z.B. Transkrip- 
tionsfaktoren) wurde mit dem „Find Pattern"-Algorithmuses aus dem 
„GCG Sequenz Analysis" Programmpacket der „Genetics Computer 
Group" (Madison, USA) durchgefuhrt. Aufgelistet sind die AbkOrzungen 
der identifizierten DNA-bindenden Faktoren und deren Lokalisation in 
Intron 2. 
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r aKiorcn 


t .nkalication in Intron 2 




2925 


CRE.2 


2749 


op I 


2178 4094 4526 4787 4835 4995 


AP-2 CS3 


5099 


AP-2 CS4 


7711 16QQ 4667 SR7R ^91R 60S9 6180 6496 
ZZIj, JO77, *rOO/, jO/o, J7JO, UUJ7, uiovj vJisyj 


AP-2 CSS 


^ko ^70fl ^RRO <?Q40 6061 61 R2 6175 6498 

J J JU, 3 / 70, JOOv, J7*TU, DUD 1, Ol Oi, UJ / J, u-ryo 


PEA3 


yj4, zoio 


P53 


one 

2125 


GR uteroglobin 


O/IO 1/10*7 TQ^6 

o4o, 14o /, Zyjo 


PR uteroglobin 


3331 


Zeste-white 


1 CT7 i£iQ 1 7m 17/K 17S7 1 R7Q 1R71 1Q11 1955 
15//, loiy, I /Uj, 1 /4j, 1/5/, 10Z7, lo/i, i7iJi i^jj, 

1QQ7 70*50 70R1 1^1 R 1700 476S ^014 5055 


GRE 


OHO 


MyoD-MCK right 
site/rev 


/t/i7 ^no 1170 1 ^Q^ 1000 9098 2099 4557 

44/, JU7, JJO, 1.5 /U, IJ7J, 17UU, iiUAO, iU7;, tJJ/ 


MyoD-MCK left site 


iaq iiq /t^7 1^66 160R 1692 1714 1818 1902 
1QR6 7177 7460 7770 1491 5010 

1 7oO, ZJ /Z, ZHOU, / J*t7i, JwU 


Ets-1 CS 


6408 


API 


3784, 4406 


CREB 


2801 


GATA-1 


839, 1390,3154 


c-Myc 


108, 118, 453, 1566, 1608, 1692, 1734, 1818, 1902, 
1986, 2372, 2460, 2720, 3491, 5030 


CACCC site 


991 


CCAAT site 


1224 


CCAC box 


992 


CAAT site 


463, 2395 


Rb site 


992, 4663 


TATA 


3650 


CDEI 


106, 1564, 1606, 1690, 1732, 1816, 1900, 1984 
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Beispiele 

Das menschliche Gen fur die katalytische Telomerase Untereinheit (ghTC), sowie die 
5' und 3' liegenden Bereiche dieses Gens wurden kloniert, der Startpunkt der 
5 Transkription bestimmt, potentielle Bindungssteilen filr DNA-bindende Proteine 
identiflziert, sowie aktive Promotorfragmente aufgezeigt. Die Sequenz der hTC- 
cDNA (Fig. 6) ist bereits in unserer ebenfalis anhSngigen Anmeldung 
PCT/EP/98/03468 beschrieben. Wenn nicht gesondert erw£hnt, beziehen sich sMmt- 
liche Angaben zur cDNA-Position auf diese Sequenz. 

10 

Beispiel 1 

Durch eine genomische Southern Blot- Analyse wurde bestimmt, ob ghTC im 
menschlichen Genom ein Einzelgen darstellt oder mehrere Loci fur das hTC-Gen 
15 bzw. eventuell auch ghTC-Pseudogene existieren. 

Hierzu wurde ein kommerziell erh&ltlicher Zoo-Blot der Firma Clontech einer 
Southern Blot-Analyse unterzogen. Dieser Blot enthSlt 4 f^g Eco RI geschnittene 
genomische DNA von neun verschiedenen Spezies (Mensch, Affe, Ratte, Maus, 

20 Hund, Rind, Kaninchen, Huhn und Hefe). Mit Ausnahme von Hefe, Huhn und 
Mensch wurde die DNA aus Nierengewebe isoliert. Die humane genomische DNA 
wurde aus Plazenta isoliert und die genomische DNA aus Huhn wurde aus Leberge- 
webe aufgereinigt. Im Autoradiogramm in Fig. 1 wurde als radioaktiv-markierte 
Sonde ein etwa 720 bp langes hTC-cDNA Fragment, isoliert aus der hTC cDNA, 

25 Variante Del2 (Position 1685 bis 2349 plus 2531 bis 2590 der Fig. 6 [Deletion 2; 
vergl. Beispiel 5 der Fig. 8]), eingesetzt. Die experimentellen Bedingungen filr die 
Hybridisierung und die Waschschritte des Blots erfolgten in Anlehnung an Ausubel 
et al. (1987). 

30 Im Fall der humanen DNA erkennt die Sonde zwei spezifische DNA-Fragmente. Das 
kleinere, etwa 1,5 bis 1,8 kb lange Eco RI-Fragment geht wahrscheinlich auf zwei 
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Eco Rl-Schnittstellen in einem Intron der ghTC-DNA zuriick. Aufgrund dieses 
Ergebnisses ist davon auszugehen, dafi nur ein singulares ghTC-Gen im 
menschlichen Genom vorliegt. 

5 Beispiel 2 

Zur Isolierung der 5' flankierenden hTC-Gensequenz wurden ca 1,5 x 10* Phagen 
einer humanen genomischen Plazenta-Genbibliothek (EMBL 3 SP6/T7 der Firma 
Clontech, Bestellnummer HL1067j) auf Nitrozellulosefilter (0,45 urn; Fa. Schleicher 

10 und Schuell) nach Angaben des Herstellers mit einem radioaktiv markierten, etwa 
500 bp langen 5'-hTC-cDNA Fragment (Position 839 bis 1345 der Fig. 6) 
hybridisiert. Die Nitrozellulosefilter wurden zunachst in 2 x SSC (0,3 M NaCl; 0,5 M 
Tris-HCl, pH 8,0) und anschlieBend in einer Prahybridisierungsldsung (50 % 
Formamid; 5 x SSPE, pH 7,4; 5 x Denhards-LOsung; 0,25 % SDS; 100 ng/ml 

15 Heringsperma-DNA) zwei Stunden bei 42°C inkubiert. Fur die Hybrididsierung iiber 
Nacht wurde die Prahybridisierungslosung mit 1,5 x 10 6 cpm/ml Lfisung dena- 
turierter, radioaktiv markierter Probe erganzt. Unspezifisch gebundene, radioaktive 
DNA wurde unter stringenten Bedingungen, d.h. durch drei fiinfminutige Wasch- 
schritte mit 2 x SSC; 0,1 % SDS bei 55 bis 65 °C entfernt. Die Auswertung erfolgte 

20 durch Autoradiographic der Filter. 

Die in dieser Prim&runtersuchung identifizierten Phagenklone wurden aufgereinigt 
Ausubel et al. (1987). In weitergehenden Analysen stellte sich ein Phagenklon P12 
als potentiell pdsitiv heraus. Eine X-DNA Praparation dieses Phagens Ausubel et al. 
25 (1987) und der nachfolgende Restriktionsverdau mit Enzymen, die das genomische 
Insert in Fragmenten freisetzen, zeigte, dafi dieser Phagenklon ein ca. 15 kb Insert im 
Vektor enthalt (Fig. 2). 

Zur Isolierung der vollstSndigen hTC-Gensequenz wurden in unabhangigen 
30 Experimenten jeweils 1 bis 1,5 x 10 6 Phagen mit jeweils verschiedenen radioaktiv 
markierten Sonden wie oben beschrieben durchmustert 
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Die in diesen PrimSruntersuchungen identifizierten, fur die entsprechenden Sonden 
positiven Phagenklone wurden aufgereinigt. Der Phagenklon PI 7 wurde mit einem 
etwa 250 bp langen hTC-cDNA Fragment (Position 1787 bis 2040 der Fig. 6) 
5 gefunden. Der Phagenklon P2 wurde mit einem etwa 740 bp langen hTC-cDNA 
Fragment (Position 1685 bis 2349 plus 2531 bis 2607 der Fig. 6 [Deletion 2; vergl. 
Beispiel 5]) identifiziert. Die Phagenklone P3 und P5 wurden mit einem 420 bp 
langen 3' hTC-cDNA Fragment (Position 3047 bis 3470 der Fig. 6) gefunden. Nach 
X-DNA Preparation dieser Phagen und nachfolgendem Restriktionsverdau mit 
10 Enzymen, die das genomische Insert in Fragmenten freisetzen, wurden die Inserts in 
Plasmide umkloniert (Beispiel 4). 

Beispiel 3 

15 Um zu untersuchen, ob auch das 5'-Ende der hTC-cDNA im Insert des rekombinan- 
ten Phagenklons P12 vorliegt, wurde X.-DNA dieses Klons in einer Southern Blot 
Analyse mit einem radioaktiv markierten etwa 440 bp langen hTC-cDNA Fragment 
(Position 1 bis 440 der Fig. 6) aus dem extremen 5'-Bereich hybridisiert (Fig, 3). 

20 Da die isolierte >.-DNA des positiven Klons auch mit dem extremen 5'-Ende der 
hTC-cDNA hybridisiert, enthalt dieser Phage wahrscheinlich auch den das ATG- 
Startcodon flankierenden 5'-Sequenzbereich. 

Beispiel 4 

25 

Um das gesamte 15 kb lange Insert des positiven Phagenklons P12 in Teilfragmenten 
umzuklonieren und anschliefiend zu sequenzieren, wurden zum DNA-Verdau 
Restriktionsendonukleasen ausgewahlt, die zum einem das gesamte Insert aus 
EMBL3 Sp6/T7 freisetzen (vgl. Beispiel 2) und zusatzlich im Insert schneiden. 



30 
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Insgesamt wurden ein etwa 8,3 und ein etwa 6,5 kb langes Xho I-Subfragment sowie 
ein etwa 8,5, ein etwa 3,5 und ein etwa 3 kb langes Sac I-Teilfragment in den Vektor 
pBluescript KS(+) (Fa. Stratagene) umkloniert. Durch Sequenzanalyse dieser 
Fragmente wurde die Nukleotidsequenz von 5123 bp 5'-flankierenden des ghTC- 
5 Genbereichs, ausgehend vom ATG-Startcodon bestimmt (Fig. 4; entsprechend 
SEQ ID NO 1). In der Fig. 4 sind die ersten (ausgehend vom ATG-Startcodon) 5123 
bp dargestellt. In der Fig. 10 (entsprechend SEQ ID NO 3) die gesamte klonierte 5' 
Sequenz. 

10 Urn das gesamte ca. 14,6 kb groBe Insert des Phagenklons P17 in Teilfragmenten 
umzuklonieren, wurden zum DNA-Verdau Restriktionsendonukleasen ausgewahlt, 
die zum einen das gesamte Insert aus EMLB3 Sp6/T7 freisetzen und zusatzlich 
einige Male im Insert schneiden. Durch Kombinationsverdau mit den Enzymen Xhol 
und BamHI wurden ein 7,1 kb, ein 4,2 kb und ein 1,5 kb groBes XhoI-BamHI- 

15 Fragment sowie ein 1,8 kb groBes BamHI-Fragment subkloniert. Der Kombinations- 
Restriktionsverdau mit den Enzymen Xhol und Xbal flihrte zur Klonierung von 
einem 6,5 kb groBen Xhol-Xbal-Fragment, einem 6,5 kb und einem 1,5 kb groBem 
Xhol-Fragment. 

20 Die Umklonierung des ca. 17,9 kb groflem Inserts des Phagenklons P2 in 
Subfragmente erfolgte durch Verdau mit dem Restriktionsenzym Xhol. Insgesamt 
wurde ein 7,5 kb, ein 6,4 kb sowie ein 1,6 kb langes Xhol-Subfragment kloniert. 
Durch Verdau mit dem Restriktionsenzym Sad wurde zusatzlich ein 4,8 kb, ein 3 kb, 
ein 2 kb sowie ein 1 ,8 kb groBes Sad-Fragment subkloniert. 

25 

Das ca. 13,5 kb groBe Insert des Phagenklons P3 wurde durch Verdau mit den 
Restriktionsenzymen Sad bzw. Xhol subkloniert. Dabei wurden ein 3,2 kb, ein 2 kb, 
ein 0,9 kb, ein 0,8 kb, ein 0,65 kb und ein 0,5 kb langes Sacl-Subfragment sowie ein 
6,5 kb und ein 4,3 kb langes Xhol-Subfragment erhalten. 
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Die Subklonierung des ca. 13,2 kb groflen Inserts des Phagenklons P5 erfolgte durch 
Verdau mit den Restriktionsenzymen Sad bzw. Xhol. Insgesamt wurden SacI- 
Fragmente von 6,5 kb, 3,3 kb, 3,2 kb, 0,8 kb und 0,3 kb Grfifie sowie Xhol- 
Fragmente von 7 kb und 3,2 kb GroBe subkloniert. 

5 

Zur Klonierung des 3* von Phagenklon PI 7 und 5 4 von Phagenklon P2 gelegenen 
hTC-genomischen Sequenzbereichs wurden 3 Genomic Walkings mit Hilfe des 
Genome Walker™ Kits der Firma Clontech (Katalognummer Kl 803-1) und ver- 
schiedenen Primerkombinationen durchgefuhrt. In einem Endvolumen von 50 |il 

10 wurde 1 humaner Genome Walker Library HDL (Fa. Clontech) mit lOpmol 
dNTP-Mix versetzt und in lxKlen Taq PCR-Reaktionspuffer und IxAdvantage Klen 
Taq Polymerase Mix (Fa. Clontech) eine PCR-Reaktion durchgefuhrt. Als Primer 
wurden 10 pmol eines internen genspezifischen Primers sowie 10 pmol des Adaptor 
Primers API (5 ' -GT A AT ACG ACTC ACT AT AGGGC-3 4 ; Fa. Clontech) zugefUgt. 

15 Die PCR wurde als Touchdown-PCR in 3 Schritten durchgefuhrt. Zunachst wurde 
uber 7 Zyklen fur 20 sec bei 94°C denaturiert und anschlieflend fiir 4 min bei 72°C 
die Primer angelagert und die DNA-Kette verlangert. Es folgten 37 Zyklen bei denen 
fur 20 sec die DNA bei 94°C denaturiert wurde, die anschliefiende Primerver- 
langerung aber fur 4 min bei 67°C erfolgte. AbschlieBend folgte eine Kettenver- 

20 langerung fur 4 min bei 67°C. Im AnschluG an diese erste PCR wurde das PCR- 
Produkt 1:50 verdiinnt. Ein |il dieser VerdUnnung wurde in einer zweiten „nested" 
PCR zusammen mit 10 pmol dNTP-Mix in lxKlen Taq PCR-Reaktionspuffer und 
IxAdvantage Klen Taq Polymerase-Mix sowie 10 pmol eines „nested" gen- 
spezifischen Primers und 10 pmol des „nested" Marathon Adaptor Primers AP2 (5'- 

25 ACT ATAGGGC ACGCGTGGT-3 ' ; Fa. Clontech) eingesetzt. Die PCR-Bedingungen 
entsprachen den in der ersten PCR gewahlten Parametern. Als einzige Ausnahme 
wurden im ersten PCR-Schritt statt 7 Zyklen nur 5 Zyklen gewahlt und im zweiten 
PCR-Schritt statt 37 Zyklen nur 24 Zyklen durchlaufen. Produkte dieser Nested- 
GenomicWalking-PCR wurden in den TA-Cloning Vektor pCRII der Fa. InVitrogen 

30 kloniert. 
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Im ersten Genomic Walking wurde der genspezifische Primer C3K2-GSP1 (5'- 
G ACGTGGCTCTTG AAGGCCTTG-3 1 ) sowie der „nested" genspezifische Primer 
C3K2-GSP2 (S'-GCCTTCTGGACCACGGCATACCO 4 ) zusammen mit der HDL- 
Library 4 eingesetzt und ein 1639 bp langes PCR-Fragment erhalten. Im zweiten 

5 Genomic Walking wurde mit dem genspezifischen Primer C3F2 (5'- 
CGTAGTTGAGCACGCTG AACAGTG-3 ') und dem „nested" genspezifischen 
Primer C3F (5 4 -CCTTCACCCTCGAGGTGAGACGCT-3*) aus der HDL-Library 4 
ein PCR-Fragment von 685 bp Lange amplifiziert. Der dritte Genomic Walking 
Ansatz fiihrte unter Einsatz des genspezifischen Primers DEL5-GSP1 (5'- 

10 GGTGG ATGTGACGGGCGCGTACG-3 ') und des „nested" genspezifischen 
Primers C5K-GSP1 (S'-GGTATGCCGTGGTCCAGAAGGCo 4 ) zur Klonierung 
eines 924 bp PCR-Fragments aus der HDL-Library 1. Insgesamt wurden durch dieses 
Genomic Walking- Verfahren 2100 bp der 3' von Phagenklon P17 gelegenen 
genomischen hTC-Region identifiziert (s. Fig. 7). 

15 

Die subklonierten Fragmente sowie die Genomic Walking-Produkte wurden ein- 
zelstrangig sequenziert. Unter Verwendung der Lasergene Biocomputing Software 
(DNASTAR Inc. Madison, Wisconsin, USA) wurden uberlappende Bereiche 
identifiziert und Contigs gebildet. Insgesamt wurden aus den gesammelten 

20 Sequenzen der Phagenklone PI 2, PI 7, P2, P3 und P5 sowie den Sequenzdaten aus 
dem Genomic Walking 2 groiie Contigs zusammengestellt. Contig 1 besteht aus 
Sequenzdaten von Phagenklon PI 2, P17 und den Sequenzdaten aus dem Genomic 
Walking. Contig 2 wurde aus den Sequenzen von Phagenklon P2, P3 und P5 
zusammengesetzt. Oberlappende Phagenklonbereiche sind in Fig. 7 schematisch 

25 dargestellt. Die Sequenzdaten der 2 Contigs sind nachfolgend dargestellt. Das ATG 
Startcodon in Contig 1 ist unterstrichen. Das TGA Stopcodon ist in Contig 2 
unterstrichen. 
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Contigl: 



ACTTGAGCCC AAGAGTTCAA GGCTACGGTG AGCCATGATT GCAACACCAC ACGCCAGCCT TGGTGACAGA 70 
ATGAGACCCT GTCTCAAAAA AAAAAAAAAA AATTGAAATA ATATAAAGCA TCTTCTCTGG CCACAGTGGA 140 
ACAAAACCAG AAATCAACAA CAAGAGGAAT TTTGAAAACT ATACAAACAC ATGAAAATTA AACAATATAC 210 
TTCTGAATGA CCAGTGAGTC AATGAAGAAA TTAAAAAGGA AATTGAAAAA TTTATTTAAG CAAATGATAA 280 
CGGAAACATA ACCTCTCAAA ACCCACGGTA TACAGCAAAA GCAGTGCTAA GAAGGAAGTT TATAGCTATA 350 
AGCAGCTACA TCAAAAAAGT AGAAAAGCCA GGCGCAGTGG CTCATGCCTG TAATCCCAGC ACTTTGGGAG 420 
GCCAAGGCGG GCAGATCGCC TGAGGTCAGG AGTTCGAGAC CAGCCTGACC AACACAGAGA AACCTTGTCG 490 
CTACTAAAAA TACAAAATTA GCTGGGCATG GTGGCACATG CCTGTAATCC CAGCTACTCG GGAGGCTGAG 560 
GCAGGATAAC CGCTTGAACC CAGGAGGTGG AGGTTGCGGT GAGCCGGGAT TGCGCCATTG GACTCCAGCC 630 
TGGGTAACAA GAGTGAAACC CTGTCTCAAG AAAAAAAAAA AAGTAGAAAA ACTTAAAAAT ACAACCTAAT 700 
GATGCACCTT AAAGAACTAG AAAAGCAAGA GCAAACTAAA CCTAAAATTG GTAAAAGAAA AGAAATAATA 770 
AAGATCAGAG CAGAAATAAA TGAAACTGAA AGATAACAAT ACAAAAGATC AACAAAATTA AAAGTTGGTT 840 
TTTTGAAAAG ATAAACAAAA TTGACAAACC TTTGCCCAGA CTAAGAAAAA AGGAAAGAAG ACCTAAATAA 910 
ATAAAGTCAG AGATGAAAAA AGAGACATTA CAACTGATAC CACAGAAATT CAAAGGATCA CTAGAGGCTA 980 
CTATGAGCAA CTGTACACTA ATAAATTGAA AAACCTAGAA AAAATAGATA AATTCCTAGA TGCATACAAC 1050 
CTACCAAGAT TGAACCATGA AGAAATCCAA AGCCCAAACA GACCAATAAC AATAATGGGA TTAAAGCCAT 1120 
AATAAAAAGT CTCCTAGCAA AGAGAAGCCC AGGACCCAAT GGCTTCCCTG CTGGATTTTA CCAATCATTT 1190 
AAAGAAGAAT GAATTCCAAT CCTACTCAAA CTATTCTGAA AAATAGAGGA AAGAATACTT CCAAACTCAT 1260 
TCTACATGGC CAGTATTACC CTGATTCCAA AACCAGACAA AAACACATCA AAAACAAACA AACAAAAAAA 1330 
CAGAAAGAAA GAAAACTACA GGCCAATATC CCTGATGAAT ACTGATACAA AAATCCTCAA CAAAACACTA 1400 
GCAAACCAAA TTAAACAACA CCTTCGAAAG ATCATTCATT GTGATCAAGT GGGATTTATT CCAGGGATGG 1470 
AAGGATGGTT CAACATATGC AAATCAATCA ATGTGATACA TCATCCCAAC AAAATGAAGT ACAAAAACTA 1540 
TATGATTATT TCACTTTATG CAGAAAAAGC ATTTGATAAA ATTCTGCACC CTTCATGATA AAAACCCTCA 1510 
AAAAACCAGG TATACAAGAA ACATACAGGC CAGGCACAGT GGCTCACACC TGCGATCCCA GCACTCTGGG 1680 
AGGCCAAGGT GGGATGATTG CTTGGGCCCA GGAGTTTGAG ACTAGCCTGG GCAACAAAAT GAGACCTGGT 1750 
CTACAAAAAA CTTTTTTAAA AAATTAGCCA GGCATGATGG CATATGCCTG TAGTCCCAGC TAGTCTGGAG 1820 
GCTGAGGTGG GAGAATCACT TAAGCCTAGG AGGTCGAGGC TGCAGTGAGC CATGAACATG TCACTGTACT 1890 
CCAGCCTAGA CAACAGAACA AGACCCCACT GAATAAGAAG AAGGAGAAGG AGAAGGGAGA AGGGAGGGAG 1960 
AAGGGAGGAG GAGGAGAAGG AGGAGGTGGA GGAGAAGTGG AAGGGGAAGG GGAAGGGAAA GAGGAAGAAG 2030 
AAGAAACATA TTTCAACATA ATAAAAGCCC TATATGACAG ACCGAGGTAG TATTATGAGG AAAAACTGAA 2100 
AGCCTTTCCT CTAAGATCTG GAAAATGACA AGGGCCCACT TTCACCACTG TGATTCAACA TAGTACTAGA 2170 
AGTCCTAGCT AGAGCAATCA GATAAGAGAA AGAAATAAAA GGCATCCAAA CTGGAAAGGA AGAAGTCAAA 2240 
TTATCCTGTT TGCAGATGAT ATGATCTTAT ATCTGGAAAA GACTTAAGAC ACCACTAAAA AACTATTAGA 2310 
GCTGAAATTT GGTACAGCAG GATACAAAAT CAATGTACAA AAATCAGTAG TATTTCTATA TTCCAACAGC 2380 
AAACAATCTG AAAAAGAAAC CAAAAAAGCA GCTACAAATA AAATTAAACA GCTAGGAATT AACCAAAGAA 2450 
GTGAAAGATC TCTACAATGA AAACTATAAA ATGTTGATAA AAGAAATTGA AGAGGGCACA AAAAAAGAAA 2520 
AGATATTCCA TGTTCATAGA TTGGAAGAAT AAATACTGTT AAAATGTCCA TACTACCCAA AGCAATTTAC 2590 
AAATTCAATG CAATCCCTAT TAAAATACTA ATGACGTTCT TCACAGAAAT AGAAGAAACA ATTCTAAGAT 2660 
TTGTACAGAA CCACAAAAGA CCCAGAATAG CCAAAGCTAT CCTGACCAAA AAGAACAAAA CTGGAAGCAT 2730 
CACATTACCT GACTTCAAAT TATACTACAA AGCTATAGTA ACCCAAACTA CATGGTACTG GCATAAAAAC 2800 
AGATGAGACA TGGACCAGAG GAACAGAATA GAGAATCCAG AAACAAATCC ATGCATCTAC AGTGAACTCA 2870 
TTTTTGACAA AGGTGCCAAG AACATACTTT GGGGAAAAGA TAATCTCTTC AATAAATGGT GCTGGAGGAA 2940 
CTGGATATCC ATATGCAAAA TAACAATACT AGAACTCTGT CTCTCACCAT ATACAAAAGC AAATCAAAAT 3010 
GGATGAAAGG CTTAAATCTA AAACCTCAAA CTTTGCAACT ACTAAAAGAA AACACCGGAG AAACTCTCCA 3080 
GGACATTGGA GTGGGCAAAG ACTTCTTGAG TAATTCCCTG CAGGCACAGG CAACCAAAGC AAAAACAGAC 3150 
AAATGGGATC ATATCAAGTT AAAAAGCTTC TGCCCAGCAA AGGAAACAAT CAACAAAGAG AAGAGACAAC 3220 
CCACAGAATG GGAGAATATA TTTGCAAACT ATTCATCTAA CAAGGAATTA ATAACCAGTA TATATAAGGA 3290 
GCTCAAACTA CTCTATAAGA AAAACACCTA ATAAGCTCAT TTTCAAAAAT AAGCAAAAGA TCTGGGTAGA 3360 
CATTTCTCAA AATAAGTCAT ACAAATGGCA AACAGGCATC TGAAAATGTG CTCAACACCA CTGATCATCA 3430 
GAGAAATGCA AATCAAAACT ACTATGAGAG ATCATCTCAT CCCAGTTAAA ATGGCTTTTA TTCAAAAGAC 3500 
AGGCAATAAC AAATGCCAGT GAGGATGTGG ATAAAAGGAA ACCCTTGGAC ACTGTTGGTG GGAATGGAAA 3570 
TTGCTACCAC TATGGAGAAC AGTTTGAAAG TTCCTCAAAA AACTAAAAAT AAAGCTACCA TACAGCAATC 3640 
CCATTGCTAG GTATATACTC CAAAAAAGGG AATCAGTGTA TCAACAAGCT ATCTCCACTC CCACATTTAC 3710 
TGCAGCACTG TTCATAGCAG CCAAGGTTTG GAAGCAACCT CAGTGTCCAT CAACAGACGA ATGGAAAAAG 3780 
AAAATGTGGT GCACATACAC AATGGAGTAC TACGCAGCCA TAAAAAAGAA TGAGATCCTG TCAGTTGCAA 3850 
CAGCATGGGG GGCACTGGTC AGTATGTTAA GTGAAATAAG CCAGGCACAG AAAGACAAAC TTTTCATGTT 3920 
CTCCCTTACT TGTGGGAGCA AAAATTAAAA CAATTGACAT AGAAATAGAG GAGAATGGTG GTTCTAGAGG 3990 
GGTGGGGGAC AGGGTGACTA GAGTCAACAA TAATTTATTG TATGTTTTAA AATAACTAAA AGAGTATAAT 4060 
TGGGTTGTTT GTAACACAAA GAAAGGATAA ATGCTTGAAG GTGACAGATA CCCCATTTAC CCTGATGTGA 4130 
TTATTACACA TTGTATGCCT GTATCAAAAT ATCTCATGTA TGCTATAGAT ATAAACCCTA CTATATTAAA 4 200 
AATTAAAATT TTAATGGCCA GGCACGGTGG CTCATGTCCG TAATCCCAGC ACTTTGGGAG GCCGAGGCGG 4 270 
GTGGATCACC TGAGGTCAGG AGTTTGAAAC CAGTCTGGCC ACCATGATGA AACCCTGTCT CTACTAAAGA 4340 
TACAAAAATT AGCCAGGCGT GGTGGCACAT ACCTGTAGTC CCAACTACTC AGGAGGCTGA GACAGGAGAA 4410 
TTGCTTGAAC CTGGGAGGCG GAGGTTGCAG TGAGCCGAGA TCATGCCACT GCACTGCAGC CTGGGTGACA 4480 
GAGCAAGACT CCATCTCAAA ACAAAAACAA AAAAAAGAAG ATTAAAATTG TAATTTTTAT GTACCGTATA 4550 
AATATATACT CTACTATATT AGAAGTTAAA AATTAAAACA ATTATAAAAG GTAATTAACC ACTTAATCTA 4620 
AAATAAGAAC AATGTATGTG GGGTTTCTAG CTTCTGAAGA AGTAAAAGTT ATGGCCACGA TGGCAGAAAT 4690 
GTGAGGAGGG AACAGTGGAA GTTACTGTTG TTAGACGCTC ATACTCTCTG TAAGTGACTT AATTTTAACC 47 60 
AAAGACAGGC TGGGAGAAGT TAAAGAGGCA TTCTATAAGC CCTAAAACAA CTGCTAATAA TGGTGAAAGG 4830 
TAATCTCTAT TAATTACCAA TAATTACAGA TATCTCTAAA ATCGAGCTGC AGAATTGGCA CGTCTGATCA 4900 
CACCGTCCTC TCATTCACGG TGCTTTTTTT CTTGTGTGCT TGGAGATTTT CGATTGTGTG TTCGTGTTTG 4970 
GTTAAACTTA ATCTGTATGA ATCCTGAAAC GAAAAATGGT GGTGATTTCC TCCAGAAGAA TTAGAGTACC 5040 
TGGCAGGAAG .CAGGTGGCTC TGTGGACCTG AGCCACTTCA ATCTTCAAGG GTCTCTGGCC AAGACCCAGG 5110 
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TGCAAGGCAG AGGCCTGATG ACCCGAGGAC AGGAAAGCTC GGATGGGAAG GGGCCATGAG AAGCCTGCCT 5180 
CGTTGGTGAG CAGCGCATGA AGTGCCCTTA TTTACGCTTT GCAAAGATTG CTCTGGATAC CATCTGGAAA 5250 
AGGCGGCCAG CGGGAATGCA AGGAGTCAGA AGCCTCCTGC TCAAACCCAG GCCAGCAGCT ATGGCGCCCA 5320 
CCCGGGCGTG TGCCAGAGGG AGAGGAGTCA AGGCACCTCG AAGTATGGCT TAAATCTTTT TTTCACCTGA 5390 
AGCAGTGACC AAGGTGTATT CTGAGGGAAG CTTGAGTTAG GTGCCTTCTT TAAAACAGAA AGTCATGGAA 5460 
GCACCCTTCT CAAGGGAAAA CCAGACGCCC GCTCTGCGGT CATTTACCTC TTTCCTCTCT CCCTCTCTTG 5530 
CCCTCGCGGT TTCTGATCGG GACAGAGTGA CCCCCGTGGA GCTTCTCCGA GCCCGTGCTG AGGACCCTCT 5600 
TGCAAAGGGC TCCACAGACC CCCGCCCTGG AGAGAGGAGT CTGAGCCTGG CTTAATAACA AACTGGGATG 5670 
TGGCTGGGGG CGGACAGCGA CGGCGGGATT CAAAGACTTA ATTCCATGAG TAAATTCAAC CTTTCCACAT 5740 
CCGAATGGAT TTGGATTTTA TCTTAATATT TTCTTAAATT TCATCAAATA ACATTCAGGA CTGCAGAAAT 5810 
CCAAAGGCGT AAAACAGGAA CTGAGCTATG TTTGCCAAGG TCCAAGGACT TAATAACCAT GTTCAGAGGG 5880 
ATTTTTCGCC CTAAGTACTT TTTATTGGTT TTCATAAGGT GGCTTAGGGT GCAAGGGAAA GTACACGAGG 5950 
AGAGGCCTGG GCGGCAGGGC TATGAGCACG GCAGGGCCAC CGGGGAGAGA GTCCCCGGCC TGGGAGGCTG 6020 
ACAGCAGGAC CACTGACCGT CCTCCCTGGG AGCTGCCACA TTGGGCAACG CGAAGGCGGC CACGCTGCGT 6090 
GTGACTCAGG ACCCCATACC GGCTTCCTGG GCCCACCCAC ACTAACCCAG GAAGTCACGG AGCTCTGAAC 6160 
CCGTGGAAAC GAACATGACC CTTGCCTGCC TGCTTCCCTG GGTGGGTCAA GGGTAATGAA GTGGTGTGCA 6230 
GGAAATGGCC ATGTAAATTA CACGACTCTG CTGATGGGGA CCGTTCCTTC CATCATTATT CATCTTCACC 6300 
CCCAAGGACT GAATGATTCC AGCAACTTCT TCGGGTGTGA CAAGCCATGA CAAAACTCAG TACAAACACC 6370 
ACTCTTTTAC TAGGCCCACA GAGCACGGSC CACACCCCTG ATATATTAAG AGTCCAGGAG AGATGAGGCT 6440 
GCTTTCAGCC ACCAGGCTGG GGTGACAACA GCGGCTGAAC AGTCTGTTCC TCTAGACTAG TAGACCCTGG 6510 
CAGGCACTCC CCCAGATTCT AGGGCCTGGT TGCTGCTTCC CGAGGGCGCC ATCTGCCCTG GAGACTCAGC 6580 
CTGGGGTGCC ACACTGAGGC CAGCCCTGTC TCCACACCCT CCGCCTCCAG GCCTCAGCTT CTCCAGCAGC 6650 
TTCCTAAACC CTGGGTGGGC CGTGTTCCAG CGCTACTGTC TCACCTGTCC CACTGTGTCT TGTCTCAGCG 6720 
ACGTAGCTCG CACGGTTCCT CCTCACATGG GGTGTCTGTC TCCTTCCCCA ACACTCACAT GCGTTGAAGG 6790 
GAGGAGATTC TGCGCCTCCC AGACTGGCTC CTCTGAGCCT GAACCTGGCT CGTGGCCCCC GATGCAGGTT 6860 
CCTGGCGTCC GGCTGCACGC TGACCTCCAT TTCCAGGCGC TCCCCGTCTC CTGTCATCTG CCGGGGCCTG 6930 
CCGGTGTGTT CTTCTGTTTC TGTGCTCCTT TCCACGTCCA GCTGCGTGTG TCTCTGCCCG CTAGGGTCTC 7000 
GGGGTTTTTA TAGGCATAGG ACGGGGGCGT GGTGGGCCAG GGCGCTCTTG GGAAATGCAA CATTTGGGTG 7070 
TGAAAGTAGG AGTGCCTGTC CTCACCTAGG TCCACGGGCA CAGGCCTGGG GATGGAGCCC CCGCCAGGGA 7140 
CCCGCCCTTC TCTGCCCAGC ACTTTCCTGC CCCCCTCCCT CTGGAACACA GAGTGGCAGT T7CCACAAGC 7210 
ACTAAGCATC CTCTTCCCAA AAGACCCAGC ATTGGCACCC CTGGACATTT GCCCCACAGC CCTGGGAATT 7280 
CACGTGACTA CGCACATCAT GTACACACTC CCGTCCACGA CCGACCCCCG CTGTTTTATT TTAATAGCTA 7350 
CAAAGCAGGG AAATCCCTGC TAAAATGTCC TTTAACAAAC TGGTTAAACA AACGGGTCCA TCCGCACGGT 7420 
GGACAGTTCC TCACAGTGAA GAGGAACATG CCGTTTATAA AGCCTGCAGG CATCTCAAGG GAATTACGCT 7490 
GAGTCAAAAC TGCCACCTCC ATGGGATACG TACGCAACAT GCTCAAAAAG AAAGAATTTC ACCCCATGGC 7 560 
AGGGGAGTGG TTAGGGGGGT TAAGGACGGT GGGGGCGGCA GCTGGGGGCT ACTGCACGCA CCTTTTACTA 7630 
AAGCCAGTTT CCTGGTTCTG ATGGTATTGG CTCAGTTATG GGAGACTAAC CATAGGGGAG TGGGGATGGG 7700 
GGAACCCGGA GGCTGTGCCA TCTTTGCCAT GCCCGAGTGT CCTGGGCAGG ATAATGCTCT AGAGATGCCC 7770 
ACGTCCTGAT TCCCCCAAAC CTGTGGACAG AACCCGCCCG GCCCCAGGGC CTTTGCAGGT GTGATCTCCG 7840 
TGAGGACCCT GAGGTCTGGG ATCCTTCGGG ACTACCTGCA GGCCCGAAAA GTAATCCAGG GGTTCTGGGA 7910 
AGAGGCGGGC AGGAGGGTCA GAGGGGGGCA GCCTCAGGAC GATGGAGGCA GTCAGTCTGA GGCTGAAAAG 7980 
GGAGGGAGGG CCTCGAGCCC AGGCCTGCAA GCGCCTCCAG AAGCTGGAAA AAGCGGGGAA GGGACCCTCC 8050 
ACGGAGCCTG CAGCAGGAAG GCACGGCTGG CCCTTAGCCC ACCAGGGCCC ATCGTGGACC TCCGGCCTCC 8120 
GTGCCATAGG AGGGCACTCG CGCTGCCCTT CTAGCATGAA GTGTGTGGGG A7TTGCAGAA GCAACAGGAA 8190 
ACCCATGCAC TGTGAATCTA GGATTATTTC AAAACAAAGG TTTACAGAAA CATCCAAGGA CAGGGCTGAA 8260 
GTGCCTCCGG GCAAGGGCAG GGCAGGCACG AGTGATTTTA TTTAGCTATT TTATTTTATT TACTTACTTT 8330 
CTGAGACAGA GTTATGCTCT TGTTGCCCAG GCTGGAGTGC AGCGGCATGA TCTTGGCTCA CTGCAACCTC 8400 
CGTCTCCTGG GTTCAAGCAA TTCTCGTGCC TCAGCCTCCC AAGTAGCTGG GATTTCAGGC GTGCACCACC 8 470 
ACACCCGCCT AATTTTGTAT TTTTAGTAGA GATGGGCTTT CACCATGTTG G7CAAGCTGA TCTCAAAATC 8540 
CTGACCTCAG GTGATCCGCC CACCTCAGCC TCCCAAAGTG CTGGGATTAC AGGCATGAGC CACTGCACCT 8610 
GGCCTATTTA ACCATTTTAA AACTTCCCTG GGCTCAAGTC ACACCCACTG GTAAGGAGTT CATGGAGTTC 8680 
AATTTCCCCT TTACTCAGGA GTTACCCTCC TTTGATATTT TCTGTAATTC TTCGTAGACT GGGGATACAC 8750 
CGTCTCTTGA CATATTCACA GTTTCTGTGA CCACCTGTTA TCCCATGGGA CCCACTGCAG GGGCAGCTGG 8820 
GAGGCTGCAG GCTTCAGGTC CCAGTGGGGT TGCCATCTGC CAGTAGAAAC CTGATGTAGA ATCAGGGCGC 8890 
AAGTGTGGAC ACTGTCCTGA ATCTCAATGT CTCAGTGTGT GCTGAAACAT GTAGAAATTA AAGTCCATCC 8960 
CTCCTACTCT ACTGGGATTG AGCCCCTTCC CTATCCCCCC CCAGGGGCAG AGGAGTTCCT CTCACTCCTG 9030 
TGGAGGAAGG AATGATACTT TGTTATTTTT CACTGCTGGT ACTGAATCCA CTGTTTCATT TGTTGGTTTG 9100 
TTTGTTTTGT TTTGAGAGGC GGTTTCACTC TTGTTGCTCA GGCTGGAGGG AGTGCAATGG CGCGATCTTG 9170 
GCTTACTGCA GCCTCTGCCT CCCAGGTTCA AGTGATTCTC CTGCTTCCGC CTCCCATTTG GCTGGGATTA 9240 
CAGGCACCCG CCACCATGCC CAGCTAATTT TTTGTATTTT TAGTAGAGAC GGGGGTGGGT GGGGTTCACC 9310 
ATGTTGGCCA GGCTGGTCTC GAACTTCTGA CCTCAGATGA TCCACCTGCC TCTGCCTCCT AAAGTGCTGG 9380 
GATTACAGGT GTGAGCCACC ATGCCCAGCT CAGAATTTAC TCTGTTTAGA AACATCTGGG TCTGAGGTAG 9450 
GAAGCTCACC CCACTCAAGT GTTGTGGTGT TTTAAGCCAA TGATAGAATT TTTTTATTGT TGTTAGAACA 9520 
CTCTTGATGT TTTACACTGT GATGACTAAG ACATCATCAG CTTTTCAAAG ACACACTAAC TGCACCCATA 9590 
ATACTGGGGT GTCTTCTCGG TATCAGCAAT CTTCATTGAA TGCCGGGAGG CGTTTCCTCG CCATGCACAT 9660 
GGTGTTAATT ACTCCAGCAT AATCTTCTGC TTCCATTTCT TCTCTTCCCT CTTTTAAAAT TGTGTTTTCT 9730 
ATGTTGGCTT CTCTGCAGAG AACCAGTGTA AGCTACAACT TAACTTTTGT TGGAACAAAT TTTCCAAACC 9800 
GCCCCTTTGC CCTAGTGGCA GAGACAATTC ACAAACACAG CCCTTTAAAA AGGCTTAGGG ATCACTAAGG 9870 
GGATTTCTAG AAGAGCGACC TGTAATCCTA AGTATTTACA AGACGAGGCT AACCTCCAGC GAGCGTGACA 9940 
GCCCAGGGAG GGTGCGAGGC CTGTTCAAAT GCTAGCTCCA TAAATAAAGC AATTTCCTCC GGCAGTTTCT 10010 
GAAAGTAGGA AAGGTTACAT TTAAGGTTGC GTTTGTTAGC ATTTCAGTGT TTGCCGACCT CAGCTACAGC 10080 
ATCCCTGCAA GGCCTCGGGA GACCCAGAAG TTTCTCGCCC CCTTAGATCC AAACTTCAGC AACCCGGAGT 10150 
CTGGATTCCT GGGAAGTCCT CAGCTGTCCT GCGGTTGTGC CGGGGCCCCA GCTCTGGAGG GGACCAGTGG 10220 
CCGTGTGGCT TCTACTGCTG GGCTGGAAGT CGGGCCTCCT AGCTCTGCAG TCCGAGGCTT GGAGCCAGGT 10290 
GCCTGGACCC CGAGGCTGCC CTCCACCCTG TGCGGGCGGG ATGTGACCAG ATGTTGGCCT CATCTGCCAG 10360 
ACAGAGTGCC GGGGCCCAGG GTCAAGGCCG TTGTGGCTGG TGTGAGGCGC CCGGTGCGCG GCCAGCAGGA 10430 
GCGCCTGGCT CCATTTCCCA CCCTTTCTCG ACGGGACCGC CCCGGTGGGT GATTAACAGA TTTGGGGTGG 10500 
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TTTGCTCATG GTGGGGACCC CTCGCCGCCT GAGAACCTGC AAAGAGAAAT GACGGGCCTG TGTCAAGGAG 10S70 

CCCAAGTCGC GGGGAAGTGT TGCAGGGAGG CACTCCGGGA GGTCCCGCGT GCCCCTCCAG GGAGCAATGC 10640 

GTCCTCGGGT TCGTCCCCAG CCGCGTCTAC GCGCCTCCGT CCTCCCCTTC ACGTCCGGCA TTCGTGGTGC 10710 

CCGGAGCCCG ACGCCCCGCG TCCGGACCTG GAGGCAGCCC TGGGTCTCCG GATCAGGCCA GCGGCCAAAG 10780 

GGTCGCCGCA CGCACCTGTT CCCAGGGCCT CCACATCATG GCCCCTCCCT CGGGTTACCC CACAGCCTAG 10850 

GCCGATTCGA CCTCTCTCCG CTGGGGCCCT CGCTGCCGTC CCTGCACCCT GGGAGCGCGA GCGGCGCGCG 10920 

GGCGGGGAAG CGCGGCCCAG ACCCCCGGGT CCGCCCGGAG CAGCTGCGCT GTCGGGGCCA GGCCGGGCTC 10990 

CCAGTGGATT CGCGGGCACA GACGCCCAGG ACCGCGCTCC CCACGTGGCG GAGGGACTGG GGACCCGGGC 11060 

ACCCGTCCTG CCCCTTCACC TTCCAGCTCC GCCTCCTCCG CGCGGACCCC GCCCCGTCCC GACCCCTCCC 11130 

GGGTCCCCGG CCCAGCCCCC TCCGGCCCCT CCCAGCCCCT CCCCTTCCTT TCCGCGGCCC CGCCCTCTCC 11200 

TCGCGGCGCG AGTTTCAGGC AGCGCTGCGT CCTGCTGCGC ACGTGGGAAG CCCTGGCCCC GGCCACCCCC 11270 

GCGATGCCGC GCGCTCCCCG CTGCCGAGCC GTGCGCTCCC TGCTGCGCAG CCACTACCGC GAGGTGCTGC 11340 

CGCTGGCCAC GTTCGTGCGG CGCCTGGGGC CCCAGGGCTG GCGGCTGGTG CAGCGCGGGG ACCCGGCGGC 11410 

TTTCCGCGCG CTGGTGGCCC AGTGCCTGGT GTGCGTGCCC TGGGACGCAC GGCCGCCCCC CGCCGCCCCC 11480 

TCCTTCCGCC AGGTGGGCCT CCCCGGGGTC GGCGTCCGGC TGGGGTTGAG GGCGGCCGGG GGGAACCAGC 11550 

GACATGCGGA GAGCAGCGCA GGCGACTCAG GGCGCTTCCC CCGCAGGTGT CCTGCCTGAA GGAGCTGGTG 11620 

GCCCGAGTGC TGCAGAGGCT GTGCGAGCGC ■ GGCGCGAAGA ACGTGCTGGC CTTCGGCTTC GCGCTGCTGG 11690 

ACGGGGCCCG CGGGGGCCCC CCCGAGGCCT TCACCACCAG CGTGCGCAGC TACCTGCCCA ACACGGTGAC 11760 

CGACGCACTG CGGGGGAGCG GGGCGTGGGG GCTGCTGCTG CGCCGCGTGG GCGACGACGT GCTGGTTCAC 11830 

CTGCTGGCAC GCTGCGCGCT CTTTGTGCTG GTGGCTCCCA GCTGCGCCTA CCAGGTGTGC GGGCCGCCGC 11900 

TGTACCAGCT CGGCGCTGCC ACTCAGGCCC GGCCCCCGCC ACACGCTAGT GGACCCCGAA GGCGTCTGGG 11970 

ATGCGAACGG GCCTGGAACC ATAGCGTCAG GGAGGCCGGG GTCCCCCTGG GCCTGCCAGC CCCGGGTGCG 12040 

AGGAGGCGCG GGGGCAGTGC CAGCCGAAGT CTGCCGTTGC CCAAGAGGCC CAGGCGTGGC GCTGCCCCTG 12110 

AGCCGGAGCG GACGCCCGTT GGGCAGGGGT CCTGGGCCCA CCCGGGCAGG ACGCGTGGAC CGAGTGACCG 12180 

TGGTTTCTGT GTGGTGTCAC CTGCCAGACC CGCCGAAGAA GCCACCTCTT TGGAGGGTGC GCTCTCTGGC 12250 

ACGCGCCACT CCCACCCATC CGTGGGCCGC CAGCACCACG CAGGCCCCCC ATCCACATCG CGGCCACCAC 12320 

GTCCCTGGGA CACGCCTTGT CCCCCGGTGT ACGCCGAGAC CAAGCACTTC CTCTACTCCT CAGGCGACAA 12390 

GGAGCAGCTG CGCCCCTCCT TCCTACTCAG CTCTCTGAGG CCCAGCCTGA CTGGCGCTCG GAGGCTCGTG 124 60 

GAGACCATCT TTCTGGGTTC CAGGCCCTGG ATGCCAGGGA CTCCCCGCAG GTTGCCCCGC CTGCCCCAGC 12530 

GCTACTGGCA AATGCGGCCC CTGTTTCTGG AGCTGCTTGG GAACCACGCG CAGTGCCCCT ACGGGGTGCT 12600 

CCTCAAGACG CACTGCCCGC TGCGAGCTGC GGTCACCCCA GCAGCCGGTG TCTGTGCCCG GGAGAAGCCC 12670 

CAGGGCTCTG TGGCGGCCCC CGAGGAGGAG GACACAGACC CCCGTCGCCT GGTGCAGCTG CTCCGCCAGC 12740 

ACAGCAGCCC CTGGCAGGTG TACGGCTTCG TGCGGGCCTG CCTGCGCCGG CTGGTGCCCC CAGGCCTCTG 12810 

GGGCTCCAGG CACAACGAAC GCCGCTTCCT CAGGAACACC AAGAAGTTCA TCTCCCTGGG GAAGCATGCC 12880 

AAGCTCTCGC TGCAGGAGCT GACGTGGAAG ATGAGCGTGC GGGACTGCGC TTGGCTGCGC AGGAGCCCAG 12950 

GTGAGGAGGT GGTGGCCGTC GAGGGCCCAG GCCCCAGAGC TGAATGCAGT AGGGGCTCAG AAAAGGGGGC 13020 

AGGCAGAGCC CTGGTCCTCC TGTCTCCATC GTCACGTGGG CACACGTGGC TTTTCGCTCA GGACGTCGAG 13090 

TGGACACGGT GATCTCTGCC TCTGCTCTCC CTCCTGTCCA GTTTGCATAA ACTTACGAGG TTCACCTTCA 13160 

CGTTTTGATG GACACGCGGT TTCCAGGCGC CGAGGCCAGA GCAGTGAACA GAGGAGGCTG GGCGCGGCAG 13230 

TGGAGCCGGG TTGCCGGCAA TGGGGAGAAG TGTCTGGAAG CACAGACGCT CTGGCGAGGG TGCCTGCAGG 13300 

TTACCTATAA TCCTCTTCGC AATTTCAAGG GTGGGAATGA GAGGTGGGGA CGAGAACCCC CTCTTCCTGG 13370 

GGGTGGGAGG TAAGGGTTTT GCAGGTGCAC GTGGTCAGCC AATATGCAGG TTTGTGTTTA AGATTTAATT 13440 

GTGTGTTGAC GGCCAGGTGC GGTGGCTCAC GCCGGTAATC CCAGCACTTT GGGAAGCTGA GGCAGGTGGA 13510 

TCACCTGAGG TCAGGAGTTT GAGACCAGCC TGACCAACAT GGTGAAACCC TATCTGTACT AAAAATACAA 13580 

AAATTAGCTG GGCATGGTGG TGTGTGCCTG TAATCCCAGC TACTTGGGAG GCTGAGGCAG GAGAATCACT 13650 

TGAACCCAGG AGGCGGAGGC TGCAGTGAGC TGAGATTGTG CCATTGTACT CCAGCCTGGG CGACAAGAGT 13720 

GAAACTCTGT CTTTAAAAAA AAAAAGTGTT CGTTGATTGT GCCAGGACAG G3TAGAGGGA GGGAGATAAG 13790 

ACTGTTCTCC AGCACAGATC CTGGTCCCAT CTTTAGGTAT GAAGAGGGCC ACATGGGAGC AGAGGACAGC 13860 

AGATGGCTCC ACCTGCTGAG GAAGGGACAG TGTTTGTGGG TGTTCAGGGG ATGGTGCTGC TGGGCCCTGC 13930 

CGTGTCCCCA CCCTGTTTTT CTGGATTTGA TGTTGAGGAA CCTCCGCTCC AGCCCCCTTT TGGCTCCCAG 14000 

TGCTCCCAGG CCCTACCGTG GCAGCTAGAA GAAGTCCCGA TTTCACCCCC TCCCCACAAA CTCCCAAGAC 14070 

ATGTAAGACT TCCGGCCATG CAGACAAGGA GGGTGACCTT CTTGGGGCTC TTTTTTTTCT TTTTTTCTTT 14140 

TTATGGTGGC AAAAGTCATA TAACATGAGA TTGGCACTCC TAACACCGTT TTCTGTGTAC AGTGCAGAAT 14210 

TGCTAACTCG GCGGTGTTTA CAGCAGGTTG CTTGAAATGC TGCGTCTTGC GTGACTGGAA GTCCCTACCC 14280 

ATCGAACGGC AGCTGCCTCA CACCTGCTGC GGCTCAGGTG GACCACGCCG AGTCAGATAA GCGTCATGCA 14350 

ACCCAGTTTT GCTTTTTGTG CTCCAGCTTC CTTCGTTGAG GAGAGTTTGA G7TCTCTGAT CAGGACTCTG 144 20 

CCTGTCATTG CTGTTCTCTG ACTTCAGATG AGGTCACAAT CTGCCCCTGG CTTATGCAGG GAGTGAGGCG 14490 

TGGTCCCCGG GTGTCCCTGT CACGTGCAGG GTGAGTGAGG CGTTGCCCCC AGGTGTCCCT GTCACGTGTA 14 560 

GGGTGAGTGA GGCGCGGCCC CCGGGTGTCC CTGTCCCGTG CAGCGTGATT GAGGTGTGGC CCCCGGGTGT 14630 

CCCTGTCACG TGTAGGGTGA GTGAGGCGCC ATCCCCGGGT GTCCCTGTCA CGTGTAGGGT GAGTGAGGCG 14700 

TGGTCCCCGG GTGTCCCTGT CCCGTGCAGG GTGAGTGAGG CACTGTCCCC GGGTGTCCCT GTCACGTGCA 14770 

GGGTGAGTGA GGCGCGGTCC CCGGGTGTCC CTCTCAGGTG TAGGGTGAGT GAGGCGCGGC CCCAGGGTGT 14840 

CCCTGTCACG TGTAGGGTGA GTGAGGCACC GTCCCTGGGT GTCCCTCCCA GGTATAGGGT GAGTGAGGCA 14910 

CTGTCCCCGG GTGTCCCTGT CACGTGCAGG GTGAGTGAGG CGCGGCCCCC GGGTGTCCCT CTCAGGTGCA 14980 

GGGTGAGTGA GGCGCTGTCC CTGGCTGTCC CTGTCTCGTG TAGGGTGAGT GAGGCTCTGT CCCCAGGTGT 15050 

CCTTGGCGTT TGCTCACTTG AGCTTGCTCC TGAATGTTTG CTCTTTCTAT AGCCACAGCT GCGCCGGTTG 15120 

CCCATTGCCT GGGTAGATGG TGCAGGCGCA GTGCTGGTCC CCAAGCCTAT CTTTTCTGAT GCTCCGCTCT 15190 

TCTTGGTCAC CTCTCCGTTC CATTTTGCTA CGGGGACACG GGACTGCAGG CTCTCGCCTC CCGCGTGCCA 15260 

GGCACTGCAG CCACAGCTTC AGGTCCGCTT GCCTCTGTTG GGCCTGGCTT GCTCACCACG TGCCCGCCAC 15330 

ATGCATGCTG CCAATACTCC TCTCCCAGCT TGTCTCATGC CGAGGCTGGA CTCTGGGCTG CCTCTGTCTG 15400 

CTGCCACGTG TTGCTGGAGA CATCCCAGAA AGGGTTCTCT GTGCCCTGAA GGAAAGCAAG TCACCCCAGC 15470 
CCCCTCACTT GTCCTGTTTT CTCCCAAGCT GCCCCTCTGC TTGGCCCCCT TGGGTGGGTG GCAACGCTTG 15540 
TCACCTTATT CTGGGCACCT GCCGCTCATT GCTTAGGCTG GGCTCTGCCT CCAGTCGCCC CCTCACATGG 15610 
ATTGACGTCC AGCCACAGGT TGGAGTGTCT CTCTCTGTCT CCTGCTCTGA GACCCACGTG GAGGGCCGGT 15680 
GTCTCCGCCA GCCTTCGTCA GACTTCCCTC TTGGGTCTTA GTTTTGAATT TCACTGATTT ACCTCTGACG 1S750 
TTTCTATCTC TCCATTGTAT GCTTTTTCTT GGTTTATTCT TTCATTCCTT TTCTAGCTTC TTAGTTTAGT 15820 
CATCCCTTTC CCTCTAAGTG CTGCCTTACC TGCACCCTGT GTTTTGATGT GAAGTAATCT CAACATCAGC 15890 
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CACTTTCAAG TGTTCTTAAA ATACTTCAAA GTGTTAATAC TTCTTTTAAG TATTCTTATT CTGTGATTTT 15960 
TTTCTTTGTG CACGCTGTGT TTTGACGTGA AATCATTTTG ATATCAGTGA CTTTTAAGTA TTCTTTAGCT 16030 
TATTCTGTGA TTTCTTTGAG CAGTGAGTTA TTTGAACACT GTTTATGTTC AAGATATGTA GAGTATCAAG 16100 
ATACGTAGAG TATTTTAAGT TATCATTTTA TTATTGATTT CTAACTCAGT TGTGTAGTGG TCTGTATAAT 16170 
ACCAATTATT TGAAGTTTGC GGAGCCTTGC TTTGTGATCT AGTGTGTGCA TGGTTTCCAG AACTGTCCAT 16240 
TGTAAATTTG ACATCCTGTC AATAGTGGGC ATGCATGTTC ACTATATCCA GCTTATTAAG GTCCAGTGCA 16310 
AAGCTTCTGT CTCCTTCTAG ATGCATGAAA TTCCAAGAAG GAGGCCATAG TCCCTCACCT GGGGGATGGG 163 BO 
TCTGTTCATT TCTTCTCGTT TGGTAGCATT TATGTGAGGC ATTGTTAGGT GCATGCACGT GGTAGAATTT 16450 
TTATCTTCCT GATGAGTGAA TCTTTTGGAG ACTTCTATGT CTCTAGTAAT CTAGTAATTC TTTTTTTAAA 16520 
TTGCTCTTAG TACTGCCACA CTGGGCTTCT TTTGATTAGT ATTTTCCTGC TGTGTCTGTT TTCTGCCTTT 16590 
AATTTATATA TATATATATA TTTTTTTTTT TTTTGAGACA GAGTCTTGGT CTGTCGCCCA GGGTGAGTGC 16660 
AGTGGTGTGA TCACAGGTCA GTGTAACTTT TACCTTCTGG CCTGAGCCGT CCTCTCACCT CAGCCTCCTG 16730 
AGTAGCTGGA ACTGCAGACA CGCACCGCTA CACCTGGCTA ATTTTTAAAT TTTTTCTGGA GACAGGGTCT 16800 
TGCTGTGTTG CCCAGGCTGG TCTCAAACTC TTGGACTCAA GGGATCCATC TACCTCGGCT TCCCAAAGTG 16870 
CTGAATTACA GGCATGAGCC ACCATGTCTG GCCTAATTTT CAACACTTTT ATATTCTTAT AGTGTGGGTA 16940 
TGTCCTGTTA ACAGCATGTA GGTGAATTTC CAATCCAGTC TGACAGTCGT TGTTTAACTG GATAACCTGA 17010 
TTTATTTTCA TTTTTTTGTC ACTAGAGACC CGCCTGGTGC ACTCTGATTC TCCACTTGCC TGTTGCATGT 17080 
CCTCGTTCCC TTGTTTCTCA CCACCTCTTG GGTTGCCATG TGCGTTTCCT GCCGAGTGTG TGTTGATCCT 17150 
CTCGTTGCCT CCTGGTCACT GGGCATTTGC TTTTATTTCT CTTTGCTTAG TGTTACCCCC TGATCTTTTT 17220 
ATTGTCGTTG TTTGCTTTTG TTTATTGAGA CAGTCTCACT CTGTCACCCA GGCTGGAGTG TAATGGCACA 17290 
ATCTCGGCTC ACTGCAACCT CTGCCTCCTC GGTTCAAGCA GTTCTCATTC CTCAACCTCA TGAGTAGCTG 17360 
GGATTACAGG CGCCCACCAC CACGCCTGGC TAATTTTTGT ATTTTTAGTA GAGATAGGCT TTCACCATGT 174 30 
TGGCCAGGCT GGTCTCAAAC TCCTGACCTC AAGTGATCTG CCCGCCTTGG CCTCCCACAG TGCTGGGATT 17500 
ACAGGTGCAA GCCACCGTGC CCGGCATACC TTGATCTTTT AAAATGAAGT CTGAAACATT GCTACCCTTG 17570 
7CCTGAGCAA TAAGACCCTT AGTGTATTTT AGCTCTGGCC ACCCCCCAGC CTGTGTGCTG TTTTCCCTGC 17 640 
TGACTTAGTT CTATCTCAGG CATCTTGACA CCCCCACAAG CTAAGCATTA TTAATATTGT TTTCCGTGTT 17710 
GAGTGTTTCT GTAGCTTTGC CCCCGCCCTG CTTTTCCTCC TTTGTTCCCC GTCTGTCTTC TGTCTCAGGC 17780 
CCGCCGTCTG GGGTCCCCTT CCTTGTCCTT TGCGTGGTTC TTCTGTCTTG TTATTGCTGG TAAACCCCAG 17850 
CTTTACCTGT GCTGGCCTCC ATGGCATCTA GCGACGTCCG GGGACCTCTG CTTATGATGC ACAGATGAAG 17 920 
ATGTGGAGAC TCACGAGGAG GGCGGTCATC TTGGCCCGTG AGTGTCTGGA GCACCACGTG GCCAGCGTTC 17 990 
CTTAGCCAGT GAGTGACAGC AACGTCCGCT CGGCCTGGGT TCAGCCTGGA AAACCCCAGG CATGTCGGGG 18060 
TCTGGTGGCT CCGCGGTGTC GAGTTTGAAA TCGCGCAAAC CTGCGGTGTG GCGCCAGCTC TGACGGTGCT 18130 
GCCTGGCGGG GGAGTGTCTG CTTCCTCCCT TCTGCTTGGG AACCAGGACA AAGGATGAGG CTCCGAGCCG 18200 
TTGTCGCCCA ACAGGAGCAT GACGTGAGCC ATGTGGATAA TTTTAAAATT TCTAGGCTGG GCGCGGTGGC 18270 
TCACGCCTGT AATCCCAGCA CTTTGGGAGG CCAAGGCGGG TGGATCACGA GGTCAGGAGG TCGAGACCAT 18340 
CCTGGCCAAC ATGATGAAAC CCCATCTGTA CTAAAAACAC AAAAATTAGC TGGGCGTGGT GGCGGGTGCC 18410 
TGTAATCCCA GCTACTCGGG AGGCTGAGGC AGGAGAATTG CTTGAACCTG GGAGTTGGAA GTTGCAGTGA 18480 
GCCGACATTG CACCACTGCA CTCCAGCCTG GCAACACAGC GAGACTCTGT CTCAAAAAAA AAAAAAAAAA 18550 
AAAAAAAAAA AATTCTAGTA GCCACATTAA AAAAGTAAAA AAGAAAAGGT GAAATTAATG TAATAATAGA 18620 
TTTTACTGAA GCCCAGCATG TCCACACCTC ATCATTTTAG GGTGTTATTG GTGGGAGCAT CACTCACAGG 18690 
ACATTTGACA TTTTTTGAGC TTTGTCTGCG GGATCCCGTG TGTAGGTCCC GTGCGTGGCC ATCTCGGCCT 18760 
GGACCTGCTG GGCTTCCCAT GCCCATGGCT GTTGTACCAG ATGGTGCAGG TCCGGGATGA GGTCGCCAGG 18830 
CCCTCAGTGA GCTGGATGTG CAGTGTCCGG ATGGTGCACG TCTGGGATGA GGTCGCCAGG CCCTGCTGTG 18900 
AGCTGGATGT GTGGTGTCTG GATGGTGCAG GTCAGGGGTG AGGTCTCCAG GCCCTCGGTG AGCTGGAGGT 18970 
ATGGAGTCCG GATGATGCAG GTCCGGGGTG AGGTCGCCAG GCCCTGCTGT GAGCTGGATG TGTGGTGTCT 19040 
GGATGGTGCA GGTCAGGGGT GAGGTCTCCA GGCCCTCGGT AAGCTGGAGG TATGGAGTCC GGATGATGCA 19110 
GGTCCGGGGT GAGGTCGCCA GGCCCTGCTG TGAGCTGGAT GTGTGGTGTC TGGATGGTGC AGGTCTGGGG 19180 
TGAGGTCACC AGGCCCTGCG GTGAGCTGGG TGTGCGGTGT CTGGATGGTG CAGGTCTGGA GTGAGGTCGC 19250 
CAGACGGTGC CAGACCATGC GGTGAGCTGG ATATGCGGTG TCCGGATGGT GCAGGTCTGG GGTGAGGTTG 19320 
CCAGGCCCTG CTGTGAGTTG GATGTGGGGT GTCCGGATGC TGCAGGTCCG GTGTGAGGTC ACCAGGCCCT 19390 
GCTGTGAGCT GGATGTGTGG TGTCTGGATG GTGCAGGTCT GGGGTGAAGG TCGCCAGGCC CCTGCTTGTG 194 60 
AGCTGGATGT GTGGTGTCTG GATGGTGCAG GTCTGGAGTG AGGTCGCCAG GCCCTCGGTG AGCTGGATGT 19530 
GCAGTGTCCA GATGGTGCAG GTCCGGGGTG AGGTCGCCAG ACCCTGCGGT GAGCTGGATG TCCGGTGTCT 19600 
GGATGGTGCA GGTCTGGAGT GAGGTCGCCA GGCCCTCGGT GAGCTGGATG TATGGAGTCC GGATGGTGCC 19670 
GGTCCGGGGT GAGGTCGCCA GACCCTGCTG TGAGCTGGAT GTGCGGTGTC TGGATGGTAC AGGTCTGGAG 19740 
TGAGGTCGCC AGACCCTGCT GTGAGCTGGA TATGCGGTGT CCGGATGGTG CAGGTCAGGG GTGAGGTCTC 19810 
CAGGCCCTCG GTGAGCTGGA GGTATGGAGT CCGGATGATG CAGGTCCGGG GTGAGGTCGC CAGGCCCTGC 19880 
TGTGAACTGG ATGTGCGGCG TCTGGATGGT GCAGGTCTGG GGTGTGGTCG CCAGGCCCTC GGTGAGCTGG 19950 
AGGTATGGAG TCCGGATGAT GCAGGTCCGG GGTGAGGTCG CCAGGCCCTG CTGTGAGCTG GATGTGCGGC 20020 
GTCTGGATGG TGCAGGTCTG GGGTGTGGTC GCCAGGCCCT CGGTGAGCTG GAGGTATGGA GTCCGGATGA 20090 
TGCAGGTCCG GGGTGAGGTT GCCAGGCCCT GCTGTGAGCT GGATGTGCTG TATCCGGATG GTGCAGTCCG 20160 
GGGTGAGGTC GCCAGGCCCT GCTGTGAGCT GGATGTGCTG TATCCGGATG GTGCAGGTCT GGGGTGAGGT 20230 
CACCAGGCCC TGCGGTGAGC TGGTTGTGCG GTGTCCGGTT GCTGCAGGTC CGGGGTGAGT TCGCCAGGCC 20300 
CTCGGTGAGC TGGATGTGCG GTGTCCCCGT GTCCGGATGG TGCAGGTCCA GGGTGAGGTC GCTAGGCCCT 20370 
TGGTGGGCTG GATGTGCCGT GTCCGGATGG TGCAGGTCTG GGGTGAGGTC GCCAGGCCTT TGGTGAGCTG 20440 
GATGTGCGGT GTCTGCATGG TGCAGGTCTG GGGTGAGGTC GCCAGGCCCT TGGTGGGCTG GATGTGTGGT 20510 
GTCCGGATGG TGCAGGTCCG GCGTGAGGTC GCCAGGCCCT GCTGTGAGCT GGATGTGCGG TGTCTGGATG 20530 
GTGCAGGTCC GGGGTGAGGT AGCCAAGGCC TTCGGTGAGC TGGATGTGGG GTGTCCGGAT GGTGCAGGTC 20650 
CGGGGTGAGG TCGCCAGGCC CTGCGGTTAG CTGGATATGC GGTGTCCGGA TGGTGCAGGT CCGGGGTGAG 20720 
GTCACCAGGC CCTGCGGTTA GCTGGATGTG CGGTGTCTGG ATGGTGCAGG TCCGGGGTGA GGTCGCCAGG 20790 
CCCTGCTGTG AGCTGGATGT GCTGTATCCG GATGGTGCAG GTCCGGGGTG AGGTCGCCAG GCCCTGCAGT 20860 
GAGCTGGATG TGCTGTATCC GGATGGTGCA GGTCTGGCGT GAGGTCGCCA GGCCCTGCGG TTAGCTGGAT 20930 
ATGCGGTGTC GGATGGTGCA GGTCCGGGGT GAGGTCACCA GGCCCTGCGG TTAGCTGGAT GTGCGGTGTC 21000 
CGGATGGTGC AGGTCTGGGG TGAGGTCGCC AGGCCCTGCT GTGAGCTGGA TGTGCTGTAT CCGGATGGTG 21070 
CAGGTCCGGG GTGAGGTCGC CAGGCCCTGC GGTGAGCTGG ATGTGCTGTA TCCGGATGGT GCAGGTCTGG 21140 
CGTGAGGTCG CCAGGCCCTG CGGTGAGCTG GATGTGCAGT GTACGGATGG TGCAGGTCCG GGGTGAGGTC 21210 
GCCAGGCCCT GCGGTGGGCT GTATGTGTGT TGTCTGGATG GTGCAGGTCC GGGGTGAGTT CGCCAGGCCC 21280 
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TGCGGTGAGC TGGATGTGTG GTGTCTGGAT GCTGCAGGTC CGGGGTGAGT TCGCCAGGCC CTCGGTGAGC 21350 
TGGATATGCG GTGTCCCCGT GTCCGAATGG TGCAGGTCCA GGGTGAGGTC GCCAGGCCCT TGGTGGGCTG 21420 
GATGTGCCGT GTCCGGATGG TGCAGGTCTG GGGTGAGGTC GCCAGGCCCT TGGTGAGCTG GATGTGCGGT 21490 
GTCCGGATGG TGCAGGTCCG GGGTGAGGTC ACCAGGCCCT CGGTGATCTG GATGTGGCAT GTCCTTCTCG 21560 
TTTAAGGGGT TGGCTGTGTT CCGGCCGCAG AGCACCGTCT GCGTGAGGAG ATCCTGGCCA AGTTCCTGCA 21630 
CTGGCTGATG AGTGTGTACG TCGTCGAGCT GCTCAGGTCT TTCTTTTATG TCACGGAGAC CACGTTTCAA 21700 
AAGAACAGGC TCTTTTTCTA CCGGAAGAGT GTCTGGAGCA AGTTGCAAAG CATTGGAATC AGGTACTGTA 21770 
TCCCCACGCC AGGCCTCTGC TTCTCGAAGT CCTGGAACAC CAGCCCGGCC TCAGCATGCG CCTGTCTCCA 21840 
CTTGCCTGTG CTTCCCTGGC TGTGCAGCTC TGGGCTGGGA GCCAGGGGCC CCGTCACAGG CCTGGTCCAA 21910 
GTGGATTCTG TGCAAGGCTC TGACTGCCTG GAGCTCACGT TCTCTTACTT GTAAAATCAG GAGTTTGTGC 21980 
CAAGTGGTCT CTAGGGTTTG TAAAGCAGAA GGGATTTAAA TTAGATGGAA ACACTACCAC TAGCCTCCTT 22050 
GCCTTTCCCT GGGATGTGGG TCTGATTCTC TCTCTCTTTT TTTTTTCTTT TTTGAGATGG AGTCTCACTC 22120 
TGTTGCCCAG GCTGGAGTGC AGTGGCATAA TCTTGGCTCA CTGCAACCTC CACCTCCTGG GTTTAAGCGA 22190 
TTCACCAGCC TCAGCCTCCT AAGTAGCTGG GATTACAGGC ACCTGCCACC ACGCCTGGCT AATTTTTGTA 22260 
CTTTTAGGAG AGACGGGGTT TCACCATGTT GGCCAGGCTG GTCTCGAACT CATGACCTCA GGTGATCCAC 22330 
CCACCTTGGC CTCCCAAAGT GCTGGGTTTA CAGGCTAAGC CACCGTGCCC AGCCCCCGAT TCTCTTTTAA 22400 
TTCATGCTGT TCTGTATGAA TCTTCAATCT ATTGGATTTA GGTCATGAGA GGATAAAATC CCACCCACTT 22470 
GGCGACTCAC TGCAGGGAGC ACCTGTGCAG GGAGCACCTG GGGATAGGAG AGTTCCACCA TGAGCTAACT 22540 
TCTAGGTGGC TGCATTTGAA TGGCTGTGAG ATTTTGTCTG CAATGTTCGG CTGATGAGAG TGTGAGATTG 22610 
TGACAGATTC AAGCTGGATT TGCATCAGTG AGGGACGGGA GCGCTGGTCT GGGAGATGCC AGCCTGGCTG 22680 
AGCCCAGGCC ATGGTATTAG CTTCTCCGTG TCCCGCCCAG GCTGACTGTG GAGGGCTTTA GTCAGAAGAT 22750 
CAGGGCTTCC CCAGCTCCCC TGCACACTCG AGTCCCTGGG GGGCCTTGTG ACACCCCATG CCCCAAATCA 22B20 
GGATGTCTGC AGAGGGAGCT GGCAGCAGAC CTCGTCAGAG GTAACACAGC CTCTGGGCTG GGGACCCCGA 22890 
CGTGGTGCTG GGGCCATTTC CTTGCATCTG GGGGAGGGTC AGGGCTTTCC CTGTGGGAAC AAGTTAATAC 22960 
ACAATGCACC TTACTTAGAC TTTACACGTA TTTAATGGTG TGCGACCCAA CATGGTCATT TGACCAGTAT 23030 
TTTGGAAAGA ATTTAATTGG GGTGACCGGA AGGAGCAGAC AGACGTGGTG GTCCCCAAGA TGCTCCTTGT 23100 
CACTACTGGG ACTGTTGTTC TGCCTGGGGG GCCTTGGAGG CCCCTCCTCC CTGGACAGGG TACCGTGCCT 23170 
TTTCTACTCT GCTGGGCCTG CGGCCTGCGG TCAGGGCACC AGCTCCGGAG CACCCGCGGC CCCAGTGTCC 23240 
ACGGAGTGCC AGGCTGTCAG CCACAGATGC CCAGGTCCAG GTCTGGCCGC TCCAGCCCCC GTGCCCCCAT 23310 
GGGTGGTTTT GGGGGAAAAG GCCAAGGGCA GAGGTGTCAG GAGACTGGTG GGCTCATGAG AGCTGATTCT 23380 
GCTCCTTGGC TGAGCTGCCC TGAGCAGCCT CTCCCGCCCT CTCCATCTGA AGGGATGTGG CTCTTTCTAC 23450 
CTGGGGGTCC TGCCTGGGGC CAGCCTTGGG CTACCCCAGT GGCTGTACCA GAGGGACAGG CATCCTGTGT 23520 
GGAGGGGCAT GGGTTCACGT GGCCCCAGAT GCAGCCTGGG ACCAGGCTCC C7GGTGCTGA TGGTGGGACA 23590 
GTCACCCTGG GGGTTGACCG CCGGACTGGG CGTCCCCAGG GTTGACTATA GGACCAGGTG TCCAGGTGCC 23660 
CTGCAAGTAG AGGGGCTCTC AGAGGCGTCT GGCTGGCATG GGTGGACGTG GCCCCGGGCA TGGCCTTCAG 23730 
CGTGTGCTGC CGTGGGTGCC CTGAGCCCTC ACTGAGTCGG TGGGGGCTTG TGGCTTCCCG TGAGCTTCCC 23800 
CCTAGTCTGT TGTCTGGCTG AGCAAGCCTC CTGAGGGGCT CTCTATTGCA GACAGCACTT GAAGAGGGTG 23870 
CAGCTGCGGG AGCTGTCGGA AGCAGAGGTC AGGCAGCATC GGGAAGCCAG GCCCGCCCTG CTGACGTCCA 23940 
GACTCCGCTT CATCCCCAAG CCTGACGGGC TGCGGCCGAT TGTGAACATG GACTACGTCG TGGGAGCCAG 24010 
AACGTTCCGC AGAGAAAAGA GGGTGGCTCT GCTTTGGTTT AACTTCCTTT TTAAACAGAA GTGCGTTTGA 24080 
GCCCCACATT TGGTATCAGC TTAGATGAAG GGCCCGGAGG AGGGGCCACG GGACACAGCC AGGGCCATGG 24150 
CACGGCGCCA ACCCATTTGT GCGCACAGTG AGGTGGCCGA GGTGCCGGTG CCTCCAGAAA AGCAGCGTGG 24220 
GGGTGTAGGG GGAGCTCCTG GGGCAGGGAC AGGCTCTGAG GACCACAAGA AGCAGCCGGG CCAGGGCCTG 24290 
GATGCAGCAC GGCCCGAGGT CCTGGATCCG TGTCCTGCTG TGGTGCGCAG CCTCCGTGCG CTTCCGCTTA 24360 
CGGGGCCCGG GGACCAGGCC ACGACTGCCA GGAGCCCACC GGGCTCTGAG GATCCTGGAC CTTGCCCCAC 24430 
GGCTCCTGCA CCCCACCCCT GTGGCTGCGG TGGCTGCGGT GACCCCGTCA TCTGAGGAGA GTGTGGGGTG 24500 
AGGTGGACAG AGGTGTGGCA TGAGGATCCC GTGTGCAACA CACATGCGGC CAGGAACCCG TTTCAAACAG 24 570 
GGTCTGAGGA AGCTGGGAGG GGTTCTAGGT CCCGGGTCTG GGTGGCTGGG GACACTCGGG AGGGGCTGCT 24 640 
TCTCCCCTGG GTCCCTATGG TGGGGTGGGC ACTTGGCCGG ATCCACTTTC CTGACTGTCT CCCATGCTGT 24710 
CCCCGCCAGG CCGAGCGTCT CACCTCGAGG GTGAAGGCAC TGTTCAGCGT GCTCAACTAC GAGCGGGCGC 24780 
GGCGCCCCGG CCTCCTGGGC GCCTCTGTGC TGGGCCTGGA CGATATCCAC AGGGCCTGGC GCACCTTCGT 24850 
GCTGCGTGTG CGGGCCCAGG ACCCGCCGCC TGAGCTGTAC TTTGTCAAGG TGGGTGCCGG GGACCCCCGT 24920 
GAGCAGCCCT GCTGGACCTT GGGAGTGGCT GCCTGATTGG CACCTCATGT TGGGTGGAGG AGGTACTCCT 24990 
GGGTGGGCCG CAGGGAGTGC AGGTGACCCT GTCACTGTTG AGGACACACC TGGCACCTAG GGTGGAGGCC 25060 
TTCAGCCTTT CCTGCAGCAC ATGGGGCCGA CTGTGCACCC TGACTGCCCG GGCTCCTATT CCCAAGGAGG 25130 
GTCCCACTGG ATTCCAGTTT CCGTCAGAGA AGGAACCGCA ACGGCTCAGC CACCAGGCCC CGGTCCCTTG 25200 
CACCCCAGTC CTGAGCCAGG GGTCTCCTGT CCTGAGGCTC AGAGAGGGGA CACAGCCCGC CCTGCCCTTG 25270 
GGGTCTGGAG TGGTGGGGGT CAGAGAGAGA GTGGGGGACA CCGCCAGGCC AGGCCCTGAG GGCAGAGGTG 25340 
ATGTCTGAGT TTCTGCGTGG CCACTGTCAG TCTCCTCGCC TCCACTCACA CAGGTGGATG TGACGGGCGC 25410 
GTACGACACC ATCCCCCAGG ACAGGCTCAC GGAGGTCATC GCCAGCATCA TCAAACCCCA GAACACGTAC 25480 
TGCGTGCGTC GGTATGCCGT GGTCCAGAAG GCCGCCCATG GGCACGTCCG CAAGGCCTTC AAGAGCCACG 25550 
TAAGGTTCAC GTGTGATAGT CGTGTCCAGG ATGTGTGTCT CTCGGATATG AATGTGTCTA GAATGCAGTC 25620 
GTGTCTGTGA TGCGTTTCTG TGGTGGAGGT ACTTCCATGA TTTACACATC TGTGATATGC GTGTGTGGCA 25690 
CGTGTGTGTC GTGGTGCATG TATCTGTGGC GTGCATATTT GTCGTGTGTG TGTGTGTGGC ACGTGTGTGT 25760 
CCATGGTGTG TGTGCCTGTG GTGTGCATGT GTGTGTGTCT GTGACACGTG CATGTTCATG CTGTGTGCTG 25830 
CATGTCTGTG ATGTGCCTAT TTGTGGTGTG TGTGTGCATG TGTCCGTGAC ATATGCGTGT CTATGGCATG 25900 
GGTGTGTGTG GCCCCTTGGC CTTACTCCTT CCTCCTCCAG GCATGGTCCG CACCATTGTC CTCACGCTCT 25970 
CGGGTGCTGG TTTGGGGAGC TCCACATTCA GGGTCCTCAC TTCTAGCATG GGTGCCCCTG TCCTGTCACA 26040 
GGGCTGGGCC TTGGAGACTG TAAGCCAGGT TTGAGAGGAG AGTAGGGATG CTGGTGGTAC CTTCCTGGAC 26110 
CCCTGGCACC CCCAGGACCC CAGTCTGGCC TATGCCGGCT CCATGAGATA TAGGAAGGCT GATTCAGCCC 26180 
TCGCTCCCCG GGACACACTC CTCCCAGAGC GGCCGGGGGC CTTGGGGCTC GGCAGGGGTG AAAGGGGCCC 26250 
TGGGCTTGGG TTCCCACCCA GTGGTCATGA GCACGCTGGA GGGGTAAGCC CTCAAAGTCG TGCCAGGCCG 26320 
GGGTGCAGAG GTGAAGAAGT ATCCCTGGAG CTTCGGTCTG GGGAGAGGCA CATGTGGAAA CCCACAAGGA 26390 
CCTCTTTCTC TGACTTCTTG AGCT 26414 
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Con tig 2: 

TGTGGGATTG GTTTTCATGT GTGGGATAGG TGGGGATCTG TGGGATTGGT TTTTATGAGT GGGGTAACAC 70 
AGAGTTCAAG GCGAGCTTTC TTCCTGTAGT GGGTCTGCAG GTGCTCCAAC AGCTTTATTG AGGAGACCAT 140 
ATCTTCCTTT GAACTATGGT CGGGTTTATA GTAAGTCAGG GGTGTGGAGG CCTCCCCTGG GCTCCCTGTT 210 
CTGTTTCTTC CACTCTGGGG TCGTGTGGTG CCTGCTGTGG TGTGTGGCCG GTGGGCAGGG CTTCCAGGCC 280 
TCCTTGTGTT CATT GCCC TG GATGTGGCCC TGGCTACGCT CCGTCCTTGG AATTCCCCTG CGAGTTGGAG 350 
GCTTTCTTTC TTTCTTTTTT TCTTTCTTTT TTTTTTTTTT TGATAACAGA GTCTCGCTCT TTTTTGCCCA 420 
GGCTGGAGTG GTTTGGCGTG ATCTTGGCTC ACTGCAACCT GTGCTTCCTG AGTTCAAGCA ATTCTCTTGC 490 
CTCAGCCTCC CAAGTAGCTG GAATTATAGG CGCCCACCAC CATGCTGACT AATTTTTGTA ATTTTAGTAG 560 
AGACGAGGTT TCTCCATGTT GGCCAGGCTG GTCTCGAACT CCTGACCTCA GGTGATCCTC CCACCTCGGC 630 
CTCCCAAAGT GCTGGGATGA CAGGTGTGAA CCGCCGCGCC CGGCCGAGAC TCGCTTCCTG CAGCTTCCGT 700 
GAGATCTGCA GCGATAGCTG CCTGCAGCCT TGGTGCTGAC AACCTCCGTT TTCCTTCTCC AGGTCTCGCT 770 
AGGGGTCTTT CCATTTCATG ACTCTCTTCA CAGAAGAGTT TCACGTGTGC TGATTTCCCG GCTGTTTCCT 840 
GCGTAATTGG TGTCTGCTGT TTATCGATGG CCTCCTTCCA TTTCCTTTAG GCTTTGTTTA TTGTTGTTTT 910 
TCCGGCTCCT TGAAGGAAAA GTTTCGATTA TGGATGTTTG AACTTTCTTT TCTAAACAAG CATCTGAAGT 980 
TGCCGTTTTC CCTCTAAAGC AGGGATCCCG AGGCCCCTGG CTGTGGAGTG GCACCGGTCT GGGGCCTGTT 1050 
AGGAACCCGG CGCACAGCGG GAGGCTAGGT GGGGTGTGGG GAGCCAGCGT TCCCGCCTGA GCCCCGCCCC 1120 
TCTCAGATCA GCAGTGGCAT GCGGTGCTCA GAGGCGCACA CACCCTACTG AGAACTGTGC GTGAGAGGGG 1190 
TCTAGATTCT GTGCTCCTTA TGGGAATCTA ATGCCTGATG ATCTGAGGTG GAACCGTTTG CTCCCAAAAC 1260 
CATCCCCTTC CCCACTGCTG TCCTGTGGAA AAATCGTCTT CCACGAAACC AGTCCCTGGT ACCACAATGG 1330 
TTGGGGACCC TGTGCTAAAG ACCTGCTTCA GCAGCCTCTC GTCAGTGTTG ATATATTGGC TTTTCTGTGT 1400 
TGAGTCCAGA ATAATTACGG ATTTCTGTGA TGCTTTCCGC CGACCTCAGA CCCATGGGCT ATTTGTGGGC 1470 
GTGTTGCCTG CTCCTGGGTT GGGAAGGGTG CAGGCCCCAT GTACCTTCCT GTTACTGCCT TCCAGGTTGG 1540 
TTCTCAGGGT TGAATCGTAC TCGATGTGGT TTTAGCCCAC GGCCCTGCCG CCAGCTCCTG GGGGCTGGGG 1610 
AACATGCTGA AGCACAGAGT CACCGTGCGC GTCTTTTGAT GCCTCACAAG CTCGAGGCCT CCTGTGTCCG 1680 
TGTTAGTGTG TGTCACGTGC CTGCTCACAT CCTGTCrTGG GGACGCAGGG GCTTAGCAGG TCCCGTAGTA 1750 
AATGACAAGC GTCCTGGGGG AGTCTGCAGA ATAGGAGGTG GGGGTGCCGG TCTCTCTCCC GCGTCTTCAG 1820 
ACTCTTCTCC TGCCTCTGCT GTGGCTGCAC CTGCATCCCT GCAATCCCTC CAGCACTGGG CTGGAGAGGC 1890 
CCGGGAGCTC GAGTGCCACT TGTGCCACGT GACTGTGGAT GGCAGTCGGT CACGGGGGTC TGATGTGTGG 1960 
TGACTGTGGA TGGCGGTTGG TCACAGGGGT CTGATGTGTG GTGACTGTGG ATGGCGGTCG TGGGGTCTGA 2030 
TGTGGTGACT GTGGATGGCG GTCGTGGGGT CTGATGTGTG GTGACTGTGG ATGGCGGTCG TGGGGTCTGA 2100 
TGTGGTGACT GTGGATGGCG GTCGTGGGGT CTGATGTGGT GACTGTGGAT GGCGGTCGTG GGGTCTGATG 2170 
TGGTGACTGT GGATGGCAGT CGTGGGGTCT GATGTGTGGT GACTGTGGAT GGCGGTCGTG GGGTCTGATG 2240 
TGGTGACTGT GGATGGCAGT CGTGGGGTCT GATGTGTGGT GACTGTGGAT GGCGGTCGTG GGGTCTGATG 2310 
TGTGGTGACT GTGGATGGCG GTCGTGGGGT CTGATGTGTG GTGACTGTGG ATGGCGGTCG TGGGGTCTGA 2380 
TGTGTGGTGA CTGTGGATGG CGGTCGTGGG GTCTGATGTG GTGACTGTGG ATGGCGGTCG TGGGGTCTGA 2450 
TGTGTGGTGA CTGTGGATGG TGATCGGTCA CAGGGGTCTG ATGTGTGGTG ACTGTGGATG GCGGTCGTGG 2520 
GGTCTGATGT GTGGTGACTG TGGATGGTGA TCGGTCACAG GGGTCTGATG TGTGGTGACT GTGGATGGCG 2590 
GTCGTGGGGT CTGATGTGTG GTGACTGTGG ATGGCGGTTG GTCCCGGGGG TCTGATGTGT GGTGACTGTG 2660 
GATGGCGATC GGTCACAGGG GTCTGATGTG TGGTGACTGT GGATGGCGGT CGTGGGGTCT GATGTGTGGT 2730 
GACTGTGGAT GGCGGTCGTG GGGTCTGATG TGTGGTGACT GTGGATGGCG GTCGTGGGGT CTGATGTGGT 2800 
GACTGTGGAT GGCGGTCGTG GGGTCTGATG TGGTGACTGT GGATGGCGGT CGTGGGGTCT GATGTGTGGT 2870 
GACTGTGGAT GGCGGTTGGT CCCGGGGGTC TGATGTGTGG TGACTGTGGA TGGCGGTCGT GGGGTCTGAT 2940 
GTGGTGACTG TGGATGGCAG TCGTGGGGTC TGATGTGTGG TGACTGTGGA TGGCGGTCGT GGGGTCTGAT 3010 
GTGTGGTGAC TGTGGATGGC GGTCGTGGGG TCTGATGTGT GGTGACTGTG GATGGCGGTC GTGGGGTCTG 3080 
ATGTGTGGTG ACTGTGGATG GCGGTCGTGG GGTCTGATGT GGTGACTGTG GATGGCGGTC GTGGGGTCTG 3150 
ATGTGTGGTG ACTGTGGATG GTGATCGGTC ACAGGGGTCT GATGTGTGGT GACTGTGGAT GGCGGTCGTG 3220 
GGGTCTGATG TGTGGTGACT GTGGATGGCG GTCGTGGGGT CTGATGTGGT GACTGTGGAT GGCGGTCGTG 3290 
GGGTCTGATG TGTGGTGACT GTGGATGGCG GTCGTAGGGT CTGATGTGTG GTGACTGTGG ATGGCAGTCG 3360 
GTCACAGGGG TCTGATGTGT GGTGACTGTG GATGGCGGTC GTGGGGTCTG ATGTGTGGTG ACTGTGGATG 3430 
GCGGTCGTGG GGTCTGATGT GTGGTGACTG TGGATGGCGG TCGTGGGGTC TGATGTGTGG TGACTGTGGA 3500 
TGGCGGTCGT GGGGTCTGAT GTGGTGACTG TGGATGGTGA TCGGTCACAG GGGTCTGATG TGTGGTAGCT 3570 
GCAGGTGGAG TCCCAGGTGT GTCTGTAGCT ACTTTGCGTC CTCGGCCCCC CGGCCCCCGT TTCCCAAACA 3640 
GAAGCTTCCC AGGCGCTCTC TGGGCTTCAT CCCGCCATCG GGCTTGGCCG CAGGTCCACA CGTCCTGATC 3710 
GGAAGAAACA AGTGCCCAGC TCTGGCCGGG GCAGGCCACA TTTGTGGCTC ATGCCCTCTC CTCTGCCGGC 3780 
AGGTCTCTAC CTTGACAGAC CTCCAGCCGT ACATGCGACA GTTCGTGGCT CACCTGCAGG AGACCAGCCC 3850 
GCTGAGGGAT GCCGTCGTCA TCGAGCAGGT CTGGGCACTG CCCTGCAGGG TTGGGCACGG ACTCCCAGCA 3920 
GTGGGTCCTC CCCTGGGCAA TCACTGCGCT CATGACCGGA CAGACTGTTG GCCCTGGGCG GCAGTGGGGG 3990 
GAATGAGCTG TGATGGGGGC ATGATGAGCT GTGTGCCTTG GCGAAATCTG AGCTGGGCCA TGCCAGGCTG 4060 
CGACAGCTGC TGCATTCAGG CACCTGCTCA CGTTTGACTG CGCGGCCTCT CTCCAGTTCC GCAGTGCCTT 4130 
TGTTCATGAT TTGCTAAATG TCTTCTCTGC CAGTTTTGAT CTTGAGGCCA AAGGAAAGGT GTCCCCCTCC 4200 
TTTAGGAGGG CAGGCCATGT TTGAGCCGTG TCCTGCCCAG CTGGCCCCTC AGTGCTGGGT CTGAGGCCAA 4270 
AGGAAACGTG TCCCCCTTCT TAGGAGGACG GGCCGTGTTT GAGCCACGCC CCGCTGAGCG GGCCTCTCAG 4 34 0 
TGCTGGGTCT GTCCACGTGG CCCTGTGGCC CTTTGCAGAT GTGGTCTGTC CACGTGGCCC TGTGGCTCTT 4410 
TGCAGATGCC TGTTAGCACT TGCTCGGCTC TAGGGGACAG TCGTGTCCAC CGCATGAGGC TCAGAGACCT 4 480 
CTGGGCGAAT TTCCTTGGCT CCCAGGGTGG GGGTGGAGGT GGCCTGGGCT GCTGGGACCC AGACCCTGTG 4550 
CCCGGCAGCT GGGCAGCAAC TCCTGGATCA CATATGCCAT CCGGGCCACG GTGGGCTGTG TGGGTGTCAG 4620 
CCCAGCTGGA CCCACAGGTG GCCCAGAGGA GACGTTCTGT GTCACACACT CTGCCTAAGC CCATGTGTGT 4690 
CTGCAGAGAC TCGGCCCGGC CAGCCCACGA TGGCCCTGCA TTCCAGCCCA GCCCCGCACT TCATCACAAA 4760 
CACTGACCCC AAAAGGGACG GAGGGTCTTG GCCACGTGGT CCTGCCTGTC TCAGCACCCA CCGGCTCACT 4830 
CCCATGTGTC TCCCGTCTGC TTTCGCAGAG CTCCTCCCTG AATGAGGCCA GCAGTGGCCT CTTCGACGTC 4900 
TTCCTACGCT TCATGTGCCA CCACGCCGTG CGCATCAGGG GCAAGTGAGT CAGCTGGCCA GGTGCCATTG 4970 
CCCTGCGGGT GGCTGGGCGG GCTGGCAGGG CTTCTGCTCA CCTCTCTCCT GCCCCTTCCC CACTGKCCTT 5040 
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CTGCCCGGGG CCACCAGAGT CTCCTTTTCT GGCCCCCGCC CCCTCCGGCT CCTGGGCTGC AGGCTCCCGA 5110 
GGCCCCGGAA ACATGGCTCG GCTTGCGGCA GCCGGAGCGG AGCAGGTGCC ACACGAGGCC TGGAAATGGC 5180 
AAGCGGGGTG TGGAGTTGCT CCTGCGTGGA GGACGAGGGG CGGGGGGTGT GTCTGGGTCA GGTGTGCGCC 5250 
GAGCGTTTGA GCCTGCAGCT TGTCAGCTCC AAGTTACTAC TGACGCTGGA CACCCGCCTC TCACACGCTT 5320 
GTATCTCTCT CTCCCGATAC AAAAGGATTT TATCCGATTC TCATTCCTGT CCCTGTCGTG TGACCCCCGC 5390 
GAGGGCGCGG GCTCTTCTCT CTGTGACTAG ATTTCCCATC TGGAAAGTGC GGGGTTGACC GTGTAGTTTG 54 60 
CTCCTCTCGG GGGGCCTGTG GTGGCCATGG GGCAGGCGGC CTGGGAGAGC TGCCGTCACA CAGCCACTGG 5530 
GTGAGCCACA CTCACGGTGG TAGAGCCACA GTGCCTGGTG CCACATCACG TCCTCTGGAT TTTAAGTAAA 5600 
ACCACACACC TCCCGGCAGG CATCTGCCTG CGACCCTGTG TGTGCCTGGG GAGAGTGGTA GCACGGAGGA 5670 
AATTCGTGCA CACTCAAGGT CATCAGCAAG GTCATCCGCA GTCAGGTGGA ACGTGGAGGC CTCTCTCTGG 5*740 
GATCGTCTCC AGO GG AT AAA GGACTGTGCA CAGCTTCGGA AGCTTTTATT TAAAAATATA ACTATTAATT 5810 
ATTGCATTAT AAGTAATCAC TAATGGTATC AGCAATTATA ATATTTATTA AAGTATAATT AGAAATATTA 5880 
AGTAGTACAC ACGTTCTGGA AAAACACAAA TTGCACATGG CAGCAGAGTG AATTTTGGCC GAGGGACACG 5950 
TGTGCACATG TGTGTAAGCG GCCCCCAGGC CCACAGAATT CGCTGACAAA GTCACCTCCC CAGAGAAGCC 6020 
ACCACGGGCC TCCTTCGTGG TCGTGAATTT TATTAAGATG GATCAAGTCA CGTACCGTCC ACGTGTGGCA 6090 
GGGCTTTGGG GAATGTGAGG TGATGACTGC GTCCTCATGC CCTGACAGAC AGGAGGTGAC TGTGTCTGTC 6160 
CTGTCCCTAG GACACGGACA GGCCCGAAGC TCTAGTCCCC ATCGTGGTCC AGTTTGGCCT CTGAATAAAA 6230 
ACGTCTTCAA AACCTGTTGC CCCAAAAACT AAGAACAGAG AGAGTTTCCC ATCCCATGTG CTCACAGGGG 6300 
CGTATCTGCT TGCGTTGACT CGCTGGGCTG GCCGGACTCC TAGAGTTGGT GCGTGTGCTT CTGTGCAAAA 6370 
AGTGCAGTCC TCTTGCCCAT CACTGTGATA TCTGCACCAG CAAGGAAAGC CTCTTTTCTT TTCTTTCTTT 6440 
TTTTTTTTTT GAGACGGAAC GTCACTGTTG TCTGCCTGGG CTTGAGTGCA GTGGCGCGAT CTCAACTCAC 6510 
TGCAACCTCC GCCTCCCGGG TTCCAGCATT TCTCCTCCCT CAGCCTCCCG AGCAGCTGAG ATTACAGGCA 6580 
CCCACCCCCT GCGCCTGGCT AATTTTTGTA TTTTTAGTAG AGAGGGGTTT TTGCCATGTT GGCCAGGCTG 6650 
GTCTCGAACT CCTGACCTCA GGTGATCCAC CCACCTCGGC CTCCCAAAGT GCTGGGATTA CAGGTGTGAG 6720 
CCATCACGCC CAGCCGGAAA GCCTCTTTTT AAGGTGACCA CCTATAGCGC TTCCCGAAAA TAACAGGTCT 6790 
TGTTTTTGCA GTAGGCTGCA AGCGTCTCTT AGCAACAGGA GTGGCGTCCT GTGGGCTCTG GGGATGGCTG 6860 
AGGGTCGCGT GGCAGCCATG CCTTCTGTGT GCACCTTTAG GTTCCACGGG GCTATTCTGC TCTCACTGTT 6930 
TGTCTGAAAA CGCACCCTTG GCATCCTTGT TTGGAGAGTT TCTGCTTCTC GTTGGTCATG CTGAAACTAG 7000 
GGGCAAGGTT GTATCCGTTG GCGCGCAGCG GCTACATGTA GGGTCATGAG TCTTTCACCG TGGACAAATT 7070 
CCTTGAAAAA AAAAAAAGGA GTCCGGTTAA GCATTCATTC CGGGTCAAGT GTCTGGTTCT GTGAATAAAC 7140 
TCTAAGATTT AAGAAACCTT AATGAAAGAA AACCTTGATG ATTCAGAGCA AGGATGTGGT CACACCTGTG 7210 
GCTGGATCTG TTTCAGCCGC CCCAGTGCAT GGTGAGAGTG GGGAGCAGGG ATTGTTTGTT CAGAGGTCTC 7280 
ATCTGGTATG TTTCTGAGGT GTTTGCCGGC TGAATGGTAG ACGTGTCGTT TGTGTGTATG AGGTTCTGTG 7350 
TCTGTGTGTG GCTCGGTTTG AGTGTACGCA TGTCCAGCAC ATGCCCTGCC CGTCTCTCAC CTGTGTCTTC 7420 
CCGCCCCAGG TCCTACGTCC AGTGCCAGGG GATCCCGCAG GGCTCCATCC TCTCCACGCT GCTCTGCAGC 7490 
CTGTGCTACG GCGACATGGA GAACAAGCTG TTTGCGGGGA TTCGGCGGGA CGGGTGAGGC CTCCTCTTCC 7560 
CCAGGGGGGC TTGGGTGGGG GTTCATTTGC TTTTGATGCA TTCAGTGTTA ATATTCCTGG TGCTCTGGAG 7630 
ACCATGACTG CTCTGTCTTG AGGAACCAGA CAAGGTTGCA GCCCCTTCTT GGTATGAAGC CGCACGGGAG 7700 
GGGTTGCACA GCCTGAGGAC TGCGGCCTCC ACGCAGGCTC TGTCCAGCGG CCATGTCCAG AGGCCTCAGG 7770 
GCTCAGCAGG CGGGAGGGCC GCTGCCCTGC ATGATGAGCA TGTGAATTCA ACACCGAGGA AGCACACCAG 7840 
CTTCTGTCAC GTCACCCAGG TTCCGTTAGG GTCCTTGGGG AGATGGGGCT GGTGCAGCCT GAGGCCCCAC 7910 
ATCTCCCAGC AGGCCCTCGA CAGGTGGCCT GGACTGGGCG CCTCTTCAGC CCATTGCCCA TCCCACTTGC 7980 
ATGGGGTCTA CACCCAAGGA CGCACACACC TAAATATCGT GCCAACCTAA TGTGGTTCAA CTCAGCTGGC 8050 
TTTTATTGAC AGCAGTTACT TTTTTTTTTT TAATACTTTA AGTTCTAGGG TACATGTGCA CGACGTGCAG 8120 
GTTAGTTACA TATGTATACA TGTGCCATGT TGGTGTGCTG CACCCATTAA CTCATCATTT ACATTAGGTA 8190 
TATCTCCTAA TGCTATCCCT CCCCACTCCC CCCATCCCAT GACAGGCCCT GGTGTGTGAT GTTCCCCACC 8260 
CTGTGTCCAA CTGTTCTCAT TGTTCAGTTC CCACCTGTGA GTGAGAACAT GTGGTGTTTG GTTTTCTTTC 8330 
CTTGCAATAG TTTGCTCAGA GTGATGGTTT CCAGCTTCGT CCATGTCCCT ACAAAGGACA TGAACTCATC 8400 
CTTTTTTATG ACTGCATAGT ATTCCGTGGT GTATATGTGC CACATTTTCT TAATCCAGTC TATCATCGAT 8470 
GGACATTTGG GTTGGTTGCA AGTCTTTGCT ACTGTGAATA GTGCCGCAAT AAACATACGT GTGCATGTGT 8540 
CTTTATAGCA GCATGATTTA TAATCCTTTG GGTATATACC CAGTAATGGG ATGGCTGGGT CAAATGGTAT 8610 
TTCTAGTTCT AGATCCTTGA GGAATCACCA CACTGTCTTC CACAATGGTT GAACTAGTTT ACACTCCCAC 8680 
CAACAGTGTA AAAGTGTTCT GGTGCTGGAG AGGATGTGGA CAGCAGTTAT TTTTTTATGA AAATAGTATC 8750 
ACTGAACAAG CAGACAGTTA GTGAAGGATG CGTCAGGAAG CCTGCAGGCC ACACAGCCAT TTCTCTCGAA 8820 
GACTCCGGGT TTTTCCTGTG CATCTTTTGA AACTCTAGCT CCAATTATAG CATGTACAGT GGATCAAGGT 8890 
TCTTCTTCAT TAAGGTTCAA GTTCTAGATT GAAATAAGTT TATGTAACAG AAACAAAAAT TTCTTGTACA 8960 
CACAACTTGC TCTGGGATTT GGAGGAAAGT GTCCTCGAGC TGGCGGCACA CTGGTCAGCC CTCTGGGACA 9030 
GGATACCTCT GGCCCATGGT CATGGGGCGC TGGGCTTGGG CCTGAGGGTC ACACAGTGCA CCATGCCCAG 9100 
CTTCCTGTGG ATAGGATCTG GGTCTCGGAT CATGCTGAGG ACCACAGCTG CCATGCTGGT AAAGGGCACC 9170 
ACGTGGCTCA GAGGGGGCGA GGTTCCCAGC CCCAGCTTTC TTACCGTCTT CAGTTATTTT TCCCTAAGAG 9240 
TCTGAGAAGT GGGGCCGCGC CTGATGGCCT TCGTTCGTCT TCAGCTGGCA CAGAATTGCA CAAGCTGATG 9310 
GTAAACACTG AGTACTTATA ATGAATGAGG AATTGCTGTA GCAGTTAACT GTAGAGAGCT CGTCTGTTGG 9380 
AAAGAAATTT AAGTTTTTCA TTTAACCGCT TTGGAGAATG TTACTTTATT TATGGCTGTG TAAATTGTTT 9450 
GACATTCAGT CCCTCGTAGA CAGATACTAC GTAAAAAGTG TAAAGTTAAC CTTGCTGTGT ATTTTCCCTT 9520 
ATTTTAGGCT GCTCCTGCGT TTGGTGGATG ATTTCTTGTT GGTGACACCT CACCTCACCC ACGCGAAAAC 9590 
CTTCCTCAGG TGAGGCCCGT GCCGTGTGTC TGTGGGGACC TCCACAGCCT GTGGGCTTTG CAGTTGAGCC 9660 
CCCCGTGTCC TGCCCCTGGC ACCGCAGCGT TGTCTCTGCC AAGTCCTCTC TCTCTGCCGG TGCTGGATCC 97 30 
GCAAGAGCAG AGGCGCTTGG CCGTGCACCC AGGCCTGGGG GCGCAGGGGC ACCTTCGGGA GGGAGTGGGT 9800 
ACCGTGCAGG CCCTGGTCCT GCAGAGACGC ACCCAGGTTA CACACGTGGT GAGTGCAGGC GGTGACCTGG 9870 
CTCCTGCTGC TCTTTGGAAA GTCAAGAGTG GCGGCTCCTG GGGCCCCAGT GAGACCCCCA GGAGCTGTGC 9940 
ACAGGGCCTG CAGGGCCGAG GCGGCAGCCT CCTCCCCAGG GTGCACCTGA GCCTGCGGAG AGCAGGAGCT 10010 
GCTGAGTGAG CTGGCCCACA GCGTTCGCTG CGGTCACGTT CCTGCGTGGG GTTGTTTGGG ATCGGTGGGA 10080 
GAATTTGGAT TTGCTGAGTG CTGCTGTCTT GAACCACGGA GATGGCTAGC AGTGGGTTTC AGAGTTGATT 10 ISO 
TTTGTGAATC AAACTAAAAT CAGGCACAGG GGACCTGGCC TCAGCACAGG GGATTGTCCA ATGTGGTCCC 10220 
CCTCAAGGGC GCCCCACAGA GCCGGTGGGC TTGTTTTAAA GTGCGATTTC ACGAGGGACG AGAAACCTTG 10290 
AAAGCTGTAA AGGGAACCCT CAGAAAATGT GGCCGCCAGG GGTGGTTTCA GGTGCTTTGC TGGGCTGTGT 10360 
TTGTGAAAAC CCATTTGGAC CCGCCCTCCA AGTCCACCCT CCAGGTCCAC CCTCCAGGGC CGCCCTGGGC 104 30 
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TGGGGGTATG CCTGGCGTTC CTTGTGCCGC AGCCCGGAGC ACAGCAGGCT GTGCACATTT AAATCCACTA 10500 
AGATTCACTC GGGGGGAGCC CAGGTCCCAA GCAACTGAGG GCTCAGGAGT CCTGAGGCTG CTGAGGGGAC 10570 
AGAGCAGACG GGGAACGCTG CTTCTGTGTG GCAAGTTCCT GAGGGTGCTG GCCAGGGAGG TGGCTCAGAG 10640 
TGTATGTTGG GGTCCCACCG GGGGCAGAAC TCTGTCTCTG ATGAGTCGGC AGCCATGTAA CAGGAAGGGG 10710 
TGGCCACAGG GAGCTGGGAA TGCACCAGGG GAGCTGCGCA GCTGGCCGAG GTCCCAGGGC CAGGCCACAG 107 80 
GAAGGGCAGG GGGACGCCCG GGGCCACAGC AGAGGCCGCA GGAAGGGAAG GGGATGCCCA GGCCAGAGCA 10850 
GAGGCTACCG GGCACAGGGG GGCTCCCTGA GCTGGGTGAG CGAGGCTCAT GACTCGGCGA GGGAACCTCC 10920 
TTGACGTGAA GCTGACGACT GGTGTTGCCC AGCTCACAGC CCAGCCAGGT CCCGCGCCTG AGCAGGAACT 10990 
CAGAACCCTC CCCTTTGTCT AAAGCACAGC AGATGCCTTC AGGGCATCTA GGAGAAAACA GGCAAAGTCG 11060 
TTGAGAAACG TCTTAAAAGA AGGTGGGATG GTGGCAATTT CTTGTCCAGA TTTTAGTCTG CCCCGGACCA 11130 
CAGATGAGTC TATAACGGGA TTGTGGTGTT GCCATGGGGA CACATGAGAT GGACCATCAC AGAGGCCACT 11200 
GGGGCTGCAC CTCCCATCTG AGTCCTGGCT GTCCCGGGTC CAGGCCAGGT TCTTGCATGC TCACCTACCT 11270 
GTCCTGCCCG GGAGACAGGG AAAGCACCCC GAAGTCTGGA GCAGGGCTGG GTCCAGGCTC CTCAGAGCTC 11340 
CTGCCAGGCC CAGCACCCTG CTCCAAATCA CCACTTCTCT GGGGTTTTCC AAAGCATTTA ACAAGGGTGT 11410 
CAGGTTACCT CCTGGGTGAC GGCCCCGCAT CCTGGGGCTG ACATTGCCCC TCTGCCTTAG GACCCTGGTC 11480 
CGAGGTGTCC CTGAGTATGG CTGCGTGGTG AACTTGCGGA AGACAGTGGT GAACTTCCCT GTAGAAGACG 11550 
AGGCCCTGGG TGGCACGGCT TTTGTTCAGA TGCCGGCCCA CGGCCTATTC CCCTGGTGCG GCCTGCTGCT 11620 
GGATACCCGG ACCCTGGAGG TGCAGAGCGA CTACTCCAGG TGAGCGCACC TGGCCGGAAG TGGAGCCTGT 11690 
GCCCGGCTGG GGCAGGTGCT GCTGCAGGGC CGTTGCGTCC ACCTCTGCTT CCGTGTGGGG CAGGCGACTG 11760 
CCAATCCCAA AGGGTCAGAG GCCACAGGGT GCCCCTCGTC CCATCTGGGG CTGAGCAGAA ATGCATCTTT 11830 
CTGTGGGAGT GAGGGTGCTC ACAACGGGAG CAGTTTTCTG TGCTATTTTG GTAAAAGGAA ATGGTGCACC 11900 
AGACCTGGGT GCACTGAGGT GTCTTCAGAA AGCAGTCTGG ATCCGAACCC AAGACGCCCG GGCCCTGCTG 11970 
GGCGTGAGTC TCTCAAACCC GAACACAGGG GCCCTGCTGG GCATGAGTCC CTCTGAACCC GAGACCCTGG 12040 
GGCCCTGCTG GGCGTGAGTC TCTCCGAACC CAGAGACTTC AGGGCCCTTT TGGGCGTGAG TCTCTCCGCT 12110 
GTGAGCCCCA CACTCCAAGG CTCATCCACA GTCTACAGGA TGCCATGAGT TCATGATCAC GTGTGACCCA 12180 
TCAGGGGACA GGGCCATGGT GTGGGGGGGG TCTCTACAAA ATTCTGGGGT CTTGTTTCCC CAGAGCCCGA 12250 
GAGCTCAAGG CCCCGTCTCA GGCTCAGACA CAAATGAATT GAAGATGGAC ACAGATGCAG AAATCTGTGC 12320 
TGTTTCTTTT ATGAATAAAA AGTATCAACA TTCCAGGCAG GGCAAGGTGG CTCACACCTA TAATCCCAGC 12390 
ACTTTGGGAG GCCGAGGTGG GTGGATCACT TGAGGCCAGG AGTTTGAGGC CAACCTAACC AACATAGTGA 124 60 
AATTCCATTT CTACTTAAAA AATACAAAAA TTAGCCTGGC CTGGTGGCAC ACGCCTGTAG TCCCCGCTAT 12530 
GCGGGAGGCT GAGGCAGGAG AATCATTTGA ACCCAGGAGG CAGAGGTTGC AGTGAGCCGA GATCACACCA 12600 
CTGCACTCCA GCCTGGCCAA CAGAGTGAGA CTTCATCTTA AAAAAAAAAA AAAAAGTATC AGCATTCCAA 12670 
AACCATAGTG GACAGGTGTT TTTTTATTCT GTCCTTCGAT AATATTTACT GGTGCTGTGC TAGAGGCCGG 12740 
AACTGGGGGT GCCTTCCTCT GAAAGGCACA CCTTCATGGG AAGAGAAATA AGTGGTGAAT GGTTGTTAAA 12810 
CCAGAGGTTT AAACTGGGGT CCTGTCGTTC TGAGTTAACA GTCCAGATCT GGACTTTGCC TCTTTCCAGA 12830 
ATGCTCCCTG GGGTTTGCTT CATGGGGGAG CAGCAGGTGT GGACACCCTC GTGATGGGGG AGCAGCAGGT 12950 
GCAGACGCCC TCATGATGGG GGAGTGGCAG GTGCAGACAC CCTTGTGCAT GGTGCCCAGC ATGTCCCTGT 13020 
TCCAGCTCCC TCCCCACAAG GATGCCGGTC TCCTGTGCTC CCCACAGTCC CTGCTTCCCT CTCACAGCCT 13090 
TACCTGGTCC TGGCCTCCAC TGGCTTTGTC TGCATGATTT CCACATTTCC TGGGCTCCCA GCACCTCTTC 13160 
GCCTCTCCCA GGCACCTCTG CAGTGCTGGC CATACCAGTC AGCTGTGAAC TGTCCACTGC TTATTTTGCT 13230 
CCCCATGAAA TGTATTTTTT AGGACAGGCA CCCCTGGTTC CAGCCTCTGG CACAGCATCA GTGAATGTTA 13300 
TTGAAGGACA AAGGACAGAC AAACAAATCA GGAAAATGGG TTCTCTCTAA ACACATTGCA AAGCCACAGA 13370 
GGCTAGTGCA GGATGGGTGG GCATCAGGTC ATCAGATGTG GGTCCAATGC CAGAATATTC TGTGCTCCCA 13440 
AAGGCCACTT GGTCAGAGTG TGTGCTTGCA GAGGTGGCTC TAAAAGCTCA GCAGTGGAGG CAGTGGTTCG 13510 
CCATACTCAG GGTGAACTCA CATCCTCTGT GTCTGAAGTA TACAGCAGAG GCTTGAAGGG CATCTGGGAG 13580 
AAGAAAACAG GCAAAATGAT TAAGAAAAGT GAAAAAGGAA AAGTGGTAAG ATGGGAATTT TCTTGTCCAG 13650 
* ATTTTAGTCT CCCAAACCAC AGCTCAGATG GTAGAATGTG GTCAGAACTG ATGGACAGAA CAATAGAACA 13720 
AAACGGAAGC CCTATCTCTC AGAAACGTGT GTTAATGTGG TATGTGGCAC AGCTGATGGA AAAGAGAGTG 13790 
TGTGTGTAAT TTTTTTTTCT GAGAAAACTG ACTGGAAGCA AATAAGTTGT GTCTTTACAG CATATACCAG 13860 
AGCAGATTCT AGGTAGAAGA GGAGACACAT GCAAACAACA CCAGCAACAG AAATAAAACA AAAGACTCAA 13930 
AGGGAAGGGA GGTGAACGTT CCCTGGTTTG GTGTTGGGGA AGGACACACA GGGAGGCGGA TGAAACCAGT 14000 
GAGGCAACGG GCATTGCTTT CACTGCAGAG AAACTCAGCT TGCCTGAGCC ACAGTGAAAA TGGCCATTCC 14070 
CTGGAGCGTT TGTGCACGTG ATTTATTTAA GGCGCCCTGT GAGGTCCTGC ACATTCATCC TCTCACTTTG 14140 
TTCTCCTAAC CACCTGAGAG GTAGAGGAGG AAAGGCTCCA GGGGAGCAGC CGCCCTTGGT CACCCAGCTG 14210 
GCAAAGGGCA TGCATGATTG CAGCCTGGCC TCCTGCTCCG GGGCCCTTGC TCTGCCCGAG GACCCCACAC 14280 
AAGTCAGACC CATAGGCTCA GGGTGAGCCG GAGCCCAAGG TCGTGTTGGG GATGGCTGTG AAAGAAGAAA 14350 
TGGACGTCTG ATGCACACTT GGGAAGGTCC TACCAGCAGC GTCAAAGAAA TGCATGTGAA ACTGACAGCG 14420 
AGACCCATCC CTCAAAGAAA CGCACGTGAA ACTGATGGCG AGACCTGTCC CCATCCCTCA TGCTGGCTCC 14490 
TTTTCTGGGC TTGCCAAGAG CCAGCATCAG GTTGAGGCAA GCTGGAAAGA CTTTTCTGGA AAGCAGCTTG 14560 
TTTGCATGGA AGTCCTCACA ATGTCCTGTG TCTTCCCAGT AATTCCACTT CTGAAGTGAC CAGACATTAT 14 630 
CACGGGTCTT ATTTACCATT TCCAGTGTTC CAGGCAGGGG GACTTGCCAC AGCAAGTCAC GAACCTGCCC 14700 
AAATACAGGG CTAAGGAGAT ATTATGCATC ACAAAACTTG CTCTGCCATT AAACATTTTT CAAAGAATTT 14770 
TTGAAGAATG TTTAATGGCA CAAAACGTTT ATTTCAATGT AGCAGTGTTC AAAGCTGGAT GTAAAAGAAC 14840 
ACACCCCAGG AGCCTGCCGT GAATGTCATG TGTGTTCATC TTTGGACATG GACATACATG GGCAGTGAGT 14910 
GGTGGTGAGG CCCTGGAGGA CATCGGTGGG ATGCCTCCAT CCTGCCCCTC TGGAGACACC ATGTGTGCCA 14980 
CGTGCACTCA CTGGAGCCCT GTTTAGCTGG TGCCACCTGG CTCTTCCATC CCTGAGATTC AAACACAGTG 15050 
AGATTCCCCA CGCCCAACTC AGTGTTCTCC CACAAAAAAC CTGAGTCACA CCTGTGTTCA CTCGAGGGAC 15120 
GCCCGGGAGC CAGGGCTCCA CAGTTTATTA TGTGTTTTTG GCTGAGTTAT GTGCAGATCT CATCAGGGCA 15190 
GATGATGAGT GCACAAACAC GGCCGTGCGA GGTTTGGATA CACTCAACAT CACTAGCCAG GTCCTGGTGG 15260 
AGTTTGGTCA TGCAGACTCT GGATGGCATG TAGCATTTGG AGTCCATGGA GTGAGCACCC AGCCCCCTCG 15330 
GGCTGCAGCG CATGCCCCAG GCAGGACAAG GAAGCGGGAG GAAGGCAGGA GGCTCTTTGG AGCAAGCTTT 15400 
GCAGGAGGGG GCTGGGTGTG GGGCAGGCAC CTGTGTCTGA CATTCCCCCC TGTGTCTCAG CTATGCCCGG 15470 
ACCTCCATCA GAGCCAGTCT CACCTTCAAC CGCGGCTTCA AGGCTGCGAG GAACATGCGT CGCAAACTCT 15540 
TTGGGGTCTT GCGGCTGAAG TGTCACAGCC TGTTTCTGGA TTTGCAGGTG AGCAGGCTGA TGGTCAGCAC 15610 
AGAGTTCAGA CTTCAGGAGG TGTGTGCGCA AGTATGTGTG TGTGTGTGTG CGCGCGTGCC TGCAAGGCTG 15680 
ATGGTGACTG GCTGCACGTA AGAGTGCACA TGTACGCATA TACACGTGAG CACATACATG TGTGCATGTG 15750 
TGTACATGAA GGCATGGCAG TGTGTGCACA GGTGTGCAAG GGCACAAGTG TGTGCACATG CGAATGCACA 15820 
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CCTGACATGC ATGTGTGTTC GTGCACAGTC GTGTGGGCAT TCACGTGAGG TGCATGCGTG TGGGTGTGCA 15890 
GTGTGAGTAG CATGTGTGCA CATAACATGT ATTGAGGGGT CCTCGTGTTC ACCCCGCTAG GTCCTCAGCA 15960 
CCAGTGCCAC TCCTTACAGG ATGAGACGGG GTCCCAGGCC TTGGTGGGCT GAGGCTCTGA AGCTGCAGCC 16030 
CTGAGGGCAT TGTCCCATCT GGGCATCCGC GTCCACTCCC TCTCCTGTGG GCTTCTGTGT CCACTCCCCC 16100 
TCTCCTGTGG GCATTTACAT CCACTCCACT CCCTCTCTCC TGTGGGCATC CGCGTCCACT CCCCCTCTCT 16170 
GTGGGCATCT GCGTCCACCT CCCCTCTCTG TGGGCATTTG CGTCCACTCC CTCTCCTGCT TCCTTCCTGT 16240 
CTTGGCCGAG CCTCGGGGGC AGGCAGATGA CACAGAGTCT TGACTCGCCC AGGGTGGTTC GCAGCTGCCG 16310 
GGTGAGGGCC AGGCCGGATT TCACTGGGAA GAGGGATAGT TTCTTGTCAA AATGTTCCTC TTTCTTGTTC 16380 
CATCTGAATG GATGATAAAG CAAAAAGTAA AAACTTAAAA TCCCAGAGAG GTTTCTACCG TTTCTCACTC 16450 
TTTCTTGGCG ACTCTAGGTG AACAGCCTCC AGACGGTGTG CACCAACATC TACAAGATCC TCCTGCTGCA 16520 
GGCGTACAGG TGAGCCGCCA CCAAGGGGTG CAGGCCCAGC CTCCAGGGAC CCTCCGCGCT CTGCTCACCT 16590 
CTGACCCGGG GCTTCACCTT GGAACTCCTG GGTTTTAGGG GCAAGGAATG TCTTACGTTT TCAGTGGTGC 16660 
TGCTGCCTGT GCACAGTTCT GTTCGCGTGG CTCTGTGCAA AGCACCTGTT CTCCATCTCT GGGTAGTGGT 16730 
AGGAGCCGGT GTGGCCCCAG GTGTCCCCAC TGTGCCTGTG CACTGGCCGT GGGACGTCAT GGAGGCCATC 16800 
CCAGGGCAGC AGGGGCATGG GGTAAAGAGA TGTTTATGGG GAGTCTTAGC AGAGGAGGCT GGGAAGGTGT 16870 
CTGAACAGTA GATGGGAGAT CAGATGCCCG GAGGATTTGG GGTCTCAGCA AAGAGGGCCG AGGTGGGTGC 16940 
AGGTGAGGGT CGCTGGCCCC ACCCCCGGGA AGGTGCAGCA GAGCTGTGGC TCCCCACACA GCCCGGCCAG 17010 
CACCTGTGCT CTGGGCATGG CTGTGCTCCT GGAACGTTCC CTGTCCTGGC TGGTCAGGGG GTGCCCCTGC 17080 
CAAGAATCGA CAACTTTATC ACAGAGGGAA GGGCCAATCT GTGGAGGCCA CAGGGCCAGC TTCTGCCTGG 17150 
AGTCAGGGCA GGTGGTGGCA CAAGCCTCGG GGCTGTACCA AAGGGCAGTC GGGCACCACA GGCCCGGCCC 17220 
TCCACCTCAA CAGGCCTCCC GAGCCACTGG GAGCTGAATG CCAGGAGGCC GAAGCCCTCG CCCCATGAGG 17290 
GCTGAGAAGG AGTGTGAGCA TTTGTGTTAC CCAGGGCCGA GGCTGCGCGA ATTACCGTGC ACACTTGATG 17360 
TGAAATGAGG TCGTCGTCTA TCGTGGAAAC CCAGCAAGGG CTCACGGGAG AGTTTTCCAT TACAAGGTCG 174 30 
TACCATGAAA ATGGTTTTTA ACCCGAGTGC TTGCGCCTTC ATGCTCTGGC AGGGAGGGCA GAGCCACAGC 17500 
TGCATGTTAC CGCCTTTGCA CCAGCTCCAG AGGCTTGGGA CCAGGCTGTC TCAGTTCCAG GGTGCGTCCG 17570 
GCTCAGACCG CCCTCCTCTC TGCCTTCTCT CTCTGCCTCA AATCTTCCCT CGTTTGCATC TCCCTGACGC 17640 
GTGCCTGGGC CCTCGTGCAA GCTGCTTGAC TCCTTTCCGG AAACCCTTGG GGTGTGCTGG ATACAGGTGC 17710 
CACTGAGGAC TGGAGGTGTC TGACACTGTG GTTGACCCCA GGGTCCAGCT GGCGTGCTTG GGGCCTCCTT 17780 
GGGCCATGAT GAGGTCAGAG GAGTTTTCCC AGGTGAAAAC TCCTGGGAAA CTCCCAGGGC CATGTGACCT 17850 
GCCACCTGCT CCTCCCATAT TCAGCTCAGT CTTGTCCTCA TTTCCCCACC AGGGTCTCTA GCTCCGAGGA 17920 
GCTCCCGTAG AGGGCCTGGG CTCAGGGCAG GGCGGCTGAG TTTCCCCACC CATGTGGGGA CCCTTGGGTA 17990 
GTCGCTTGAT TGGGTAGCCC TGAGGAGGCC GAGATGCGAT GGGCCACGGG CCGTTTCCAA ACACAGAGTC 18060 
AGGCACGTGG AAGGCCCAGG AATCCCCTTC CCTCGAGGCA GGAGTGGGAG AACGGAGAGC TGGGCCCCGA 18130 
TTTCACGGCA GCCAGGCTGC AGTGGGCGAG GCTGTGGTGG TCCACGTGGC GCTGGGGGCG GGGTCTGATT 18200 
CAAATCCGCT GGGGCTCGGC CTTCCTGGCC CGTGCTGGCC GCGCCTCCAC ACGGGCTTGG GGTGGACGCC 18270 
CCGACCTCTA GCAGGTGGCT ATTTCTCCCT TTGGAAGAGA GCCCCTCACC CATGCTAGGT GTTTCCCTCC 18340 
TGGGTCAGGA GCGTGGCCGT GTGGCAACCC CGGGACCTTA GGCTTATTTA TTTGTTTAAA AACATTCTGG 18410 
GCCTGGCTTC CGTTGTTGCT AAATGGGGAA AAGACATCCC ACCTCAGCAG AGTTACTGAG AGGCTGAAAC 18480 
CGGGGTGCTG GCTTGACTGG TGTGATCTCA GGTCATTCCA GAAGTGGCTC AGGAAGTCAG TGAGACCAGG 18550 
TACATGGGGG GCTCAGGCAG TGGGTGAGAT GAGGTACACG GGGGGCTCAG GCAGTGGGTG AGGCCAGGTA 18620 
CATGGGGGGC TCAGGCACTG GGTGAGATGA GGTACACGGG GGGCTCAGGC AGAGGGTCAG ACCAGGTACA 18690 
CGGGGGCTCT GATCACACGC ACATATGAGC ACATGTGCAC ATGTGCTGTT TCATGGTAGC CAGGTCTGTG 187 60 
CACACCTGCC CCAAAGTCCC AGGAAGCTGA GAGGCCAAAG ATGGAGGCTG ACAGGGCTGG CGCGGTGGCT 18830 
CACACCTGTA GTCCCAGCAC TTTGGGAGGC CGAGGCGAGA GGATCCCTTG AGCCCAGGAG TTTAAGACCA 18900 
GCCTGAGCAA CATAGTAGAA CCCCATCTCT ATGAAAAATA AAAACAAAAA TTAGCTGAAC ATGGTGGTGT 16970 
GCGCCTGTAG TTCCAATACT TGGGAGGCTG AAGTGGGAGG ATCACTTGAG CCCAGGAGGT GGAAGCTGCA 19040 
GTGAGCTGAG ATTGCACCAC TGTACTGCAG CCTGGGTGAC AGAGTGAGAG CCCATCTCAA CAACAACAAA 19110 
GAAGACTGAC AAATGCAGTT TCTTGGAAAG AAACATTTAG TAGGAACTTA ACCTACACAC AGAAGCCAAG 19180 
TCGGTGTCTC GGTGTCAGTG AGATGAGATG ATGGGTCCTC ACACCATCAC CCCAGACCCA GGGTTTATGC 19250 
ACCACAGGGG CGGGTGGCTC AGAAGGGATG CGCAGGACGT TGATATACGA TGACATCAAG GTTGTCTGAC 19320 
GAAGGGCAGG ATTCATGATA AGTACCTGCT GGTACACAAG GAACAATGGA TAAACTGGAA ACCTTAGAGG 19390 
CCTTCCCGGA ACAGGGGCTA ATCAGAAGCC AGCATGGGGG GCTGGCATCC AGGATGGAGC TGCTTCAGCC 194 60 
TCCACATGCG TGTTCATACA GATGGTGCAC AGAAACGCAG TGTACCTGTG CACACACAGA CACGCAGCTA 19530 
CTCGCACACA CAAGCACACA CACAGACATG CATGCATGCA TCCGTGTGTG TGCACCTGTG CCCATGAGGA 19600 
AACCCATGCA TGTGCATTCA TGCACGCACA CAGGCACCGG TGGGCCCATG CCCACACCCA CGAGCACCGT 19670 
CTGATTAGGA GGCCTTTCCT CTGACGCTGT CCGCCATCCT CTCAGGTTTC ACGCATGTGT GCTGCAGCTC 19740 
CCATTTCATC AGCAAGTTTG GAAGAACCCC ACATTTTTCC TGCGCGTCAT CTCTGACACG GCCTCCCTCT 19810 
GCTACTCCAT CCTGAAAGCC AAGAACGCAG GTATGTGCAG GTGCCTGGCC TCAGTGGCAG CAGTGCCTGC 19880 
CTGCTGGTGT TAGTGTGTCA GGAGACTGAG TGAATCTGGG CTTAGGAAGT TCTTACCCCT TTTCGCATCA 19950 
GGAAGTGGTT TAACCCAACC ACTGTCAGGC TCGTCTGCCC GCCCTCTCGT GGGGTGAGCA GAGCACCTGA 20020 
TGGAAGGGAC AGGAGCTGTC TGGGAGCTGC CATCCTTCCC ACCTTGCTCT GCCTGGGGAA GCGCTGGGGG 20090 
GCCTGGTCTC TCCTGTTTCC CCCATGGTGG GATTTGGGGG GCCTGGCCTC TCCTGTTTGC CCTGTGGTGG 20160 
GATTGGGCTG TCTCCCGTCC ATGGCACTTA GGGCCCTTGT GCAAACCCAG GCCAAGGGCT TAGGAGGAGG 20230 
CCAGGCCCAG GCTACCCCAC CCCTCTCAGG AGCAGAGGCC GCGTATCACC ACGACAGAGC CCCGCGCCGT 20300 
CCTCTGCTTC CCAGTCACCG TCCTCTGCCC CTGGACACTT TGTCCAGCAT CAGGGAGGTT TCTGATCCGT 20370 
CTGAAATTCA AGCCATGTCG AACCTGCGGT CCTGAGCTTA ACAGCTTCTA CTTTCTGTTC TTTCTGTGTT 204 40 
GTGGAAATTT CACCTGGAGA AGCCGAAGAA AACATTTCTG TCGTGACTCC TGCGGTGCTT GGGTCGGGAC 20510 
AGCCAGAGAT GGAGCCACCC CGCAGACCGT CGGGTGTGGG CAGCTTTCCG GTGTCTCCTG GGAGGGGAGC 20580 
TGGGCTGGGC CTGTGACTCC TCAGCCTCTG TTTTCCCCCA GGGATGTCGC TGGGGGCCAA GGGCGCCGCC 20650 
GGCCCTCTGC CCTCCGAGGC CGTGCAGTGG CTGTGCCACC AAGCATTCCT GCTCAAGCTG ACTCGACACC 20720 
GTGTCACCTA CGTGCCACTC CTGGGGTCAC TCAGGACAGG CAAGTGTGGG TGGAGGCCAG TGCGGGCCCC 20790 
ACCTGCCCAG GGGTCATCCT TGAACGCCCT GTGTGGGGCG AGCAGCCTCA GATGCTGCTG AAGTGCAGAC 20860 
GCCCCCGGGC CTGACCCTGG GGGCCTGGAG CCACGCTGGC AGCCCTATGT GATTAAACGC TGGTGTCCCC 20930 
AGGCCACGGA GCCTGGCAGG GTCCCCAACT TCTTGAACCC CTGCTTCCCA TCTCAGGGGC GATGGCTCCC 21000 
CACGCTTGGG AGCCTTCTGA CCCCTGACCT GTGTCCTCTC ACAGCCTCTT CCCTGGCTGC TGCCCTGAGC 21070 
TCCTGGGGTC CTGAGCAAGT TCTCTCCCCG CCCCGCCGCT CCAGCGTCAC TGGGCTGCCT GTCTGCTCGC 21140 
CCCGGTGGAG GGCTGTCTGT CCCTTCACTG AGGTTCCCAC CAGCCAGGGC CACGAGGTGC ACGCCCTGCC 21210 
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TGCCCGGCCA CCCACACGTC CTAGGAGGGT TGGAGGATGC 

ATTTTGGCCC CGCAGCCCAG ACGCAGCTGA GTCGGAAGCT 

CGCAGCCAAC CCGGCACTGC CCTCAGACTT CAAGACCATC 

GCCGAGAGCA GACACCAGCA GCCCTGTCAC GCCGGGCTCT 

CCAGGCCCGC ACCGCTGGGA GTCTGAGGCC TGAGTGAGTG 

GCTGAGTGTC CGGCTGAGGC CTGAGCGAGT GTCCAGCCAA 

CACTTCCCCA CAGGCTGGCG CTCGGCTCCA CCCCAGGGCC 

CTCCCCACAT AGGAATAGTC CATCCCCAGA TTCGCCATTG 

CCACCCCCAC CATCCAGGTG GAGACCCTGA GAAGGACCCT 

GTGTGCCCTG TACACAGGCG AGGACCCTGC ACCTGGATGG 

GCTGTGGGAG TAAAATACTG AATATATGAG TTTTTCAGTT 

GTGCACTGCA TAGACACCAC TGTATGCAAT TACAGAAGCC 

GCCCATGGCC TGGCTGTGCA TTTACGGAAG TCTATGAGTG 

CCTGGCTGGG CCTGGGAGGT TTCTGATGCT GTGAGGCAGG 

GAGCCCCCAC CCTGGAAGAC ATAACAGTAA GTCCAGGCCC 

TTGGGCGGCG GGGATGATGG AGGGCCTGGC CAGGGTGGCA 

GGGGTGATGG GGGGGGCTGG TCTGGGTGGC GGGGAAGATG 

GCCTCCCACC TGCAGCCGTG GATCCGGATG TGCTTCCCTG 

GGAGGTGGGG GGCAGGGGCA TGACACCATC CTGTATAAAA 

TCAGGTTGAA AGTCACATTC CGCCTCTGGC CATTCTCTTA 

GTGGGTAGGG TGGGGCAGTG GAGGGTGTGG ACACAGGAGG 

TCCTCTTATC ATCTCCCAGT CTCATCTCTC ATCCTCTTAT 

TCTCCCAGTC TCATCTGTCA TCCTCTTACC ATCTCCCAGT 

CATCCAGACT TACCTCCCAG GGCGGGTGCC AGGCTCGCAG 

GAAGGAACTG GAAGGATTGC AGAGAACAGG AGGGGCGGCT 

AGCCCCTCCT CAGAAGTTGG CTTGGGCCAC ACGAAACCGA 

CAGCAGGTCC CTGGTGGGGC CTTATGGTAT GGCCGGGTCC 

TTTGAGTGCA GCCCGGACGT GCCTGGTGTC GGGGTGGGGG 

TGCTGCTGCT TCAGAGAATG TCTGAGTGAC CGAGCCTAAT 

GTCGTAAATG CACTCTGGTG CCTGGAGCCC CCGTATAGGA 

GGCCTGGGGG CGCCTTTGCC CTGCAAACTG GAAGGGAGCG 

GTGAGAGGTT GGACAGAACA GGGCGGGGAC TTCCCAGGAG 

TGAATCACAG ACCAACaGGT CAGGCCATTG TTCAGCTATC 

CTCCGGGTGT TTTTTGTTGA AATTTTACTC AGGATTACTT 

AAAAGGTATT TGCTTTGATA TGGCTTAACT CACTAAGCAC 

TATTATTATT ATTAGAGATG GTGTCTACTC TGTCACCCAG 

GCTGTAGCCG CAAACCCCCA GGCTCAAGTG ATCCTCCGGC 

TGTGAGCCAC TGCCCTTGCC TGGCACTTTT AAAAACCACT 

CTGTCATCCC AGTAGTTTGG GAAGCCGAGG CAGAAGGATT 

GGTAACATAG GGAGACCCCA TCTCTACAAA AAATGCAAAA 

AGTCCCAGCT GCTCGGGAGG CTGAGTGGGA GGATCGCTTG 

TGATTGTACC ATCGCACTCC AGCCTGGGCA- ACAGAGTGAG 

AAGGAGAAGG AGAAGAGAAG AAGAAGGAAG AAGGAAAGAG 

AAGGAGGCCT GCTAGGTGCT AGGTAGACTG TCAAATCTCA 

GGAAAGAAAA ACCCCAGCTC TTTGGACTTC CTTAGGCCTG 

ACAAGCGTGT ATGGAGCGAG TGAGTTCAAA GCAGAAAGGG 

GTGACACCAG CCAGGACCCC TGAAAGGGAG TGGTTCTTTT 

TGCACCTGCT GTAACCGTCG ATGTTGGTGC CAGGTGCCCA 

CAAACTTTGG TGGGTTTCAG AAGCCCCAGG CACTTGTGGC 

CCCACGTCCT TCTCCTGGAA CCTGTGAATG TGTCACCCGC 

AATCACGGCT GCCAGTCAGC CGATCTTAAG GTCATCCTGG 

GGTCCCTAGA AGTGAGAGAG GGAGGCAGGG GAGAGTCAGA 

GCTGGCTTTG AGATGGAGGA GGGGGTCCCC AGCCAAGGAA 

AGCAATCCTC CCCGGTCCTG AGGGCACACG GCCCTGCCCA 

TCAGCTTTCC GGCCTCCAGA GCTGTAAGAT GATGCGTTTG 

ACAGCAGCAA ATGGAATAGC AGTACAGGGA AATGAATACA 
CCCCTGGG 



CACCTCTGGC CTCTTCTGGA ACGGAGTCTG 21280 
CCCGGGGACG ACGCTGACTG CCCTGGAGGC 21350 
CTGCACTGAT GGCCACCCGC CCACAGCCAG 21420 
ACGTCCCAGG GAGGGAGGGG CGGCCCACAC 21490 
TTTGGCCGAG GCCTGCATGT CCGGCTGAAG 21560 
GGGCTGAGTG TCCAGCACAC CTGCCGTCTT 21630 
AGCTTTTCCT CACCAGGAGC CCGGCTTCCA 21700 
TTCACCCCTC GCCCTGCCCT CCTTTGCCTT 21770 
GGGAGCTCTG GGAATTTGGA GTGACCAAAG 21840 
GGGTCCCTGT GGGTCAAATT GGGGGGAGGT 21910 
TTGAAAAAAA TCTCATGTTT GAATCCTAAT 21980 
TGTGAGTGAA CGGGGTGGTG GTCAGTGCGG 22050 
AATGGGGTTG TGGTCAGTGC GGGCCCATGG 22120 
AGGGGAAGGA GGGTAGGGGA TAGACAGTGG 22190 
GAAGGGCAGC AGGGATGCTG GGGGCCCAGC 22260 
GGGATGATGG GGGCCCCAGC TGGGGTGGCA 22330 
GGGAAGCCTG GCTGGGCCCC CTCCTCCCCT 22400 
GTGCACATCC TCTGGGCCAT CAGCTTTCAT 22470 
TCCAGGATTC CTCCTCCTGA ACGCCCCAAC 22540 
AGAGTAGACC AGGATTCTGA TCTCTGAAGG 22610 
CTTCAGGGTG GGGCTGGTGA TGCTCTCTCA 22680 
CATCTCCCAG TCTCATCTGT CTTCCTCTTA 22750 
CTCATCTCTT ATCCTCTTAT CTCCTAGTCT 22820 
TGGAGCTGGA CATACGTCCT TCCTCAGGCA 22890 
CAGAGGGACG CAGTCTTGGG GTGAAGAAAC 22960 
GGGCCCTGCG TGAGTGGCTC CAGAGCCTTC 23030 
TACTGAGTGC ACCTTGGACA GGGCTTCTGG 2 3100 
CTTATGGCCA CTGGATATGG CGTCATTTAT 2 3170 
GTGTATGGTG GGCCCAAGTC CACAGACTGT 23240 
GCTGTGAGGA AGGAGGGGCT CTTGGCAGCC 23310 
GCCCCGGGCG CCGTGGGCGG ACGACCTCAA 23380 
CAGAGGCCGC TGCTCAGGCA CACCTGGGTT 23450 
CATCTTCTAC AAAGCTCCAG ATTCCTGT7T 23520 
ATATTTTTTG CTAAAGTATT AGACCCTTAA 23590 
CTACTTTATT TGTCTGTTTT TATTTATTAT 23660 
GTTGTTAGTG CAGTGGCACA GTCATGGCTC 2 3730 
CTCAGCTTCC CAGAGTGCTG GGATTACAGG 23800 
ATGTAAGGTC AGGTCCAGTG GCTTCCACAC 23870 
GTCTGAGGCC AGGAGTTTGA GACCAGCATG 23940 
AGTTATCCGG GCGTGGGGTC CAGCATCTGT 24 010 
AGCCCGGGAG GTCATGGCTG CAGTGAGCTG 24080 
ACCCTGTCTC AAAAAAAAAA AAAAAAAAAG 2 4 ISO 
AAGAAGAAGG AAGAAGGAAG AAAGAAGGAG 24220 
GAGCAAAATG AAAATAACAA AGTTTTAAAG 24290 
AACTTCATCT CAAGCAGCTT CCTTCCACAG 24 360 
AGGAGAAGCA GGCAAGGGTG GAGGCTGTGG 24 4 30 
CCTGCCTCAG CCCCACGCTC CTGCCGGTCC 24 500 
CCTGGGAAGG ATGCTGTGCA GGGGGCTTGC 24570 
AGGCACAATT ACAGCCCCTC CCCAAAGATG 24 640 
AAGGCAGAGG CTGGTGAAGG CTGCAGGTGG 24 710 
ATTATCTGGT GGGCCTGATA TGGCCACAAG 24780 
GAGGGGACGT GAGAAGGACC ACTGGCCACT 24 850 
TGGGGGCAGC CGCTCCATGC TGGAAAAGCA 24 920 
CGCCTCGATT TCAGGCCAGT GGGACCTGTT 24990 
TGTTCAGCCA CTAAGCTGCA GTGATTCGTC 25060 
GGGACAGTTC TCAGAGTGAC TCTCAGCCCA 25130 

25138 



Beispiel 5 

Der Vergleich der oben beschriebenen genomischen hTC-Sequenz mit der Sequenz 
der hTC-cDNA (Fig. 6; entsprechend SEQ ID NO 2) ermoglichte die Aufkiarung der 
Exon-Intron-Struktur des hTC-Gens. Die genomische Organisation des hTC-Gens ist 
in Fig. 7 schematisch dargestellt. Die kodierende Region des hTC-Gens setzt sich aus 
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16 Exons zusammen, die in ihrer Gr6Be zwischen 62 bp und 1354 bp variieren (s. 
Tabelle 1). Exon 1 enthalt das Translationsstartcodon ATG. Das Translations- 
stopcodon TGA sowie der 3' untranslatierte Bereich liegen auf Exon 16 (Fig. 8), Ein 
mogliches Polyadenylierungssignal (AATAAA) wurde weder in Exon 16 noch in 
den 3195 bp der folgenden 3*-flankierenden Region gefunden. Basierend auf der 
Konsensussequenz 

5 4 -Exon Intron 3'-Exori 

Pra-mRNA A/C A G I G T A/G A . . . N C A 6 | G 

Hauflgk.(%) 70 60 80 100 100 95 70 80 100 100 60 

wurden die Exon-Intron-Ubergange bestimmt und in Tabelle 1 aufgefuhrt. Mit 
Ausnahme der 5*-Splice-Stelle zwischen Exon 15 und Intron 15 stimmen alle Exon- 
Intron-Ubergange mit der publizierten (Shapiro und Senapathy, 1987) Splice- 
Konsensussequenz Qberein. Die GroBe der Introns liegt zwischen 104 bp und 8616 
bp. Da Intron 6 nur zum Teil isoliert wurde, kann die exakte L&ige des hTC-Gens 
nicht bestimmt werden. Basierend auf der von Intron 6 erhaitenen Teilsequenz von 
-4660 bp betragt die minimale GroBe des hTERT Gens 37 kb. 
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Die Introns 1-5 sowie der 5*-Bereich des Introns 6 sind in Contig 1 enthalten: 
Intron 1: bp 1 1493-1 1596 (SEQ ID NO 4); 
Intron2:bp 12951-21566 (SEQ ID NO 5); 
Intron 3: bp 21763-23851 (SEQ ID NO 6); 
5 Intron 4: bp 24033-247 1 9 (SEQ ID NO 7); 
Intron 5: bp 24900-25393 (SEQ ID NO 8); 
5*-Bereich von Intron 6: bp 25550-26414 (SEQ ID NO 9). 

Der 3*-Bereich des Introns 6 sowie die Introns 7-15 sind in Contig 2 an folgenden 
10 Positionen lokalisiert: 

3'-Bereich von Intron 6: bp 1-3782 (SEQ ID NO 10); 

Intron 7: bp 3879-4858 (SEQ ID NO 1 1); 

Intron 8: bp 4945-7429 (SEQ ID NO 12); 

Intron 9: bp 7544-9527 (SEQ ID NO 13); 
15 Intron 10: bp 9600-1 1470 (SEQ ID NO 14); 

Intron 11: bp 11660-15460 (SEQ ID NO 15; 

Intron 12: bp 15588-16467 (SEQ ID NO 16); 

Intron 1 3 : bp 1 6530-1 971 5 (SEQ ID NO 1 7); 

Intron 14: 19841-20621 (SEQ ID NO 18); 
20 Intron 1 5 : 20760-2 1 295 (SEQ ID NO 1 9). 

Der 3'-nichttranskribierte Bereich befindet sich ebenfalls im Contig 2 an Position 
21960-25138 (SEQ ID NO 20). 



25 



Die genannten Introns haben im einzelnen folgende Sequenzen: 
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Intron 1 (SEQ ID NO 4) 

GTGGGCCTCCCCGGGGTCGGCGTCCGGCTGGGGTTGAGGG 
CGACTCAGGG CGCTTCCCC CGCAG 

Intron 2 (SEQ ID NO 5) 

GTGAGGAGGTGGTGGCCGTCGAGGGCCCAGGCCCCAGAGCTGAATGCAGTAGGGGCTCAGAAAAGGGGGCAGG 
CTGGTCCTCCTGTCTCCATCGTCACGTGGGCACACGTGGCTTTT 

TCTG CTCTCCCTCCTGTCCAGTTTG CATAAACTTACGAGGTTCACCTTCACX3TTTTG ATGGACACG CGGTTTCCAGGCGC 
CGAGGCCAGAGCAGTGAACAGAGGAGGCTGGGCGCX3GCAGTGGAGCCGGGTTC 

CACAGACG CTCTGGCGAGGGTGCCTG CAGGTTACCTATAATCCTCTTCGCAATTTCAAGGGTGGGAATG AG AGGTGGGG A 
CGAGAACCCCCTCTTCCTGGGGGTGGGAGGTAAGGGTTTTGC^^ 

AG ATTT AATTGTGTGTTG ACGGCCAGGTGCGGTGG CTCACGCCGGTAATCC CAG CACTTTGGGAAG CTGAGGCAGGTGGA 

TCACCTGAGGTCAGGAGTTTGAGACCAGCCTGACCAACATGGTGAAACCCT^ 

GGCATGGTGGTGTGTGCCTGTAATCCCAGCTACTTGGGAGGCTGAGGCAGGAGAATCACTTGAA 

TGCAGTG AG CTGAGATTGTGCCATTGT ACTC CAGCCTGG GCG AOUVGAGTGAAACTCTGTCTTT AAAAAAAAAAAG 

CGTTGATTGTG C CAGG ACAGGGTAGAGGG AGGGAGATAAGACTGTTCTCCAGCACAGATCCTGGTCCCATCTTT AGGTAT 

GAAGAGGGCCACATGGGAGCAGAGGACAGCAGATGGCTCCACCTGCTGAGGAAGGGACAGTGTTTGT 

ATGGTGCTGCTGGGCCCTGCCGTGTCCCCACCCTGTTTTTCTGGATTTGATGTTGAGGAACCTCCGCTC 

TGGCTCCCAGTGCTCCCAGGCCCTACCGTGGCAGCTAGAAGAAGTCCCGATTTCACCCCCTCCCCACAAACT 

ATGTAAGACTTCCGGCCATGCAGACAAGGAGGGTGACCTTCTTGGGGCTCTT^ 

AAAAGTCAT ATAACATG AG ATTGGCACTCCTAACAC CGTTTTCTGTGTACAGTG CAGAATTG CTAACTCGG CGG TGTTT A 
CAGCAGGTTG CTTGAAATGCTGCGTCTTGCGTGACTGGAAGTCCCTACCCATCGAACGGCAG CTG CCTCACACCTGCTGC 
GGCTCAGGTGGACCACGCCGAGTCAGATAAGCGTCATGCAACCCAGTTTTGCTTTTTG 

G AG AGTTTG AGTT CTCTG ATCAGGACTCTG CCTGTCATTG CTGTTCTCTG ACTTCAG ATGAGGTCACAATCTG C CCCTGG 
CTTATGCAGGGAGTGAGGCGTGGTCCCCGGGTGTCCCTGTCA(X3TC 

GTCACGTGTAGGGTGAGTGAGGCGCGGCCCCCGGGTGTCCCTGTCCraTGCAGCGTGATTGAGGTGTGGCCCCCGGGTGT 
CCCTGTCACGTGTAGGGTGAGTGAGGCGCCATCCCCGGGTGTCCCTGTCACGTGTAGGGTGAGTGAGGCGTGGTCCCCGG 
GTGTCCCTGTCCCGTGCAGGGTGAGTGAGGCACTGTCCCCGGGTGTCCCTC 

CCGGGTGTCCCTCTCAGGTGTAGGGTGAGTGAGGCGCGG CCCCAGGGTGTCCCTGTCACGTGTAGGGTG AGTGAGG CACC 

GTCCCTGGGTGTCCCTCCCAGGTATAGGGTGAGTGAGGCACTGT^ 

CGCGGCCCCCGGGTGTCCCTCTa^GGTGCAGGGTGAGTC^ 

GAGG CTCTGTCCCCAGGTGTCCTTGGCGTTTG CTCACTTG AG CTTGCTCCTG AATGTTTGCTCTTT CT ATAGC CACAG CT 
GCGCCGGTTGCCCATTGCCTGGGTAGATGGTGCAGGCG^ 

TCTTGGTCACCTCTCCGTTCCATTTTGCTACGGGGACACGGGACTGCAGGCTCTCGCCT 

CCACAGCTTCAGGTCCGCTTGCCrCTGTTGGGCCTGGCTrGCTCACCACGTC 

TCTCCCAGCTTGTCTCATGCCGAGGCTGGACTCTGGGCTGCCTGTGTCTC 

AGGGTTCTCTGTGCCCTGAAGGAAAGCAAGTCACCCCAGCCCCCTCACTTGTC 

TTGGCCCCCTTGGGTGGGTGGCAACGCTTGTCACCTTATTC^ 

CCAGTCGCCCCCTCACATGGATTGACGTCCAGCCACAGGTTGGAGTGTCTCT 
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GAGGGCCGGTGTCTCCGCCAGCCTTCGTCAGACTTCCCTCTTGGGTCTTAGTTTT 
TTTCTATCTCTCCATTGTATGCTTTTTCTTGGTTTATTCTT^ 

CCTCTAAGTGCTGCCTTACCTGCACCCTGTGTTTTGATGTGAAGTAATCTCAACATCAG 

ATACTTCAAAGTGTTAATACTTCITTTAAGTATTCTTATTCTGTG A TTTTT^ 

AATCATTTTGATATCAGTGACTTTTAAGTATTCTTTAGCTTATTCTGTGATTTC T TTG 

GTTTATGTTCAAGATATGTAGAGTATCAAGATACGTAGAGTATTTTAAGTTATCATTTTATTATTGATT^ 

TGTGTAGTGGTCTGTATAAT ACCAATTATTTGAAGTTTGCGG AGCCTTG CTTTGTG ATCTAGTGTGTG CATGGTTTCCAG 

AACTOTCCATTGTAAATTTGACATCCTGTCAATAGTGGGCATGCATGTTCACT 

AAGCTTCTGTCTCCTTCTAGATGCATGAAATTCCAAGAAGGAGGCCATAGTCCCT 

TCTTCTCGTTTGGTAGCATTTATGTGAGGCATTGTTAGGTGCATGCACG TGGTAGAATTTTTATCTT CCTGATGAGTGAA 
TCTTTTGGAGACTTCTATGTCTCTAGTAATCTAGTAATTCTTTTTTTAAATTGCT 

TTTG ATT AG T ATTTTCCTG CTGTG T CTGTTTT CTG C CTTT AATTTATAT AT AT AT AT AT ATTTTTTTTTTTTTTG AG ACA 

GAGTCTTGGTCTGTCGCCCAGGGTGAGTGCAGTGGTGTGATC^CAGGTCAGTGTAACTTTTACCTTCTGGCCTGAGCCGT 

CCTCTCACCTCAGCCTCCTGAGTAGCTGGAACTGCAGACACGCACCGCT^ 

GACAGGGTCTTGCTGTGTTGCCCAGGCTGGTCTCAAACTCTTGGACTCAAGGGATCCATCTA 

CTG AATTACAGG CATCAGCCACCATG TCTGG CCTAATTTTCAACACTTTTATATTCTT ATAGTC 

ACAGCATGTAGGTGAATTTCCAATCCAGTCTGACAGTCGTTGTTTAACTGGATAACCTGATTTA 

ACTAGAGACCCGCCTGGTGCACTCTGATTCTCCACTTGCCTGTTGCATGTCCTCGTTCCCTTG 

CTTTGCTTAGTGTTACCCCCTGATCTTTTTATTGTCGTTGTTTGCTTITC 

GGCTGGAGTGTAATGGCACAATCTCGGCTCACTGCAACCTCTGCCTCCTCGGTTCA^ 

TGAGTAGCTGGGATTACAGGCGCCCACCACCACGCCTGGCTAATTTTTGTATTTTTAGTAGAGATAG^ 

TGGCCAGGCTGGTCTCAAACTCCTGACCTCAAGTGATCTGCCCGCCTTGGC 

G CCACCGTG CCCGGCATACCTTGATCTTTTAAAATG AAGTCTG AAACATTGCTACCCT^ 

AGTGTATTTTAGCTCTGGCCACCCCCCAGCCTGTGTGCTGTTrTCCCTGCTGACTTAGTTCTATCTCAGG 

CCCCCACAAGCTAAGCATTATTAATATTGTTTTCCGTGTTGAGTGTTTCTGTAGCTTTGCCCCCG 

TTTGTTCCCCGTCTGTCTTCTGTCTCAGGCCCGCC^ 

TTATTCCTGGTAAACCCCAGCTTTACCTGTGCTGGCCTCCATGGCATCT 

ACAGATG AAGATGTGGAG ACTCACG AGG AGGGCGGT CATCTTGG CCCGTGAGTGTCTGG AG CACCACGTGGCCAGCGTTC 
CTTAGCCAGTGAGTGACAGCAACGTCCGCTCGGCCTGGGTTCAGCCTGGAAAACCCCAGG 
CCGCGGTGTCGAGTTTGAAATCGCGCAAACCTGCGGTGTGGCGCCAGCTCTGACGGTGC 
CTTCCTCCCTTCTGCTTGGGAACCAGGACAAAGGATGAGGCTCCGAGCCGTTG 

ATGTGG AT AATTTT AAAATTT CT AGGCTG GGCGCGGTGGCT CACG C CTGTAAT C C CAGCACTTTGGG AGG C CAAGG CGGG 

TGG ATCACGAGGTC^GGAGGTCGAGACCAT CCTGGC CAACATG ATGAAACC CCATCTGT ACTAAAAA C 

TGGGCGTGGTGGCGGGTGCCTGTAATCCCAGCTACTCGGGAGGCTGAGGCAGGAGAATTGCTTGAACCT^ 

GTTGCAGTGAGCCGACATTGCACCACTGCACTCCAGCCTGGCAACACAGCGAGACTCTGTCTCAAA^ 

AAAAAAAAAAAATTCTAGTAGCCACATTAAAAAAGTAAAAAAGAAAAGGTGAAATTAATGTAATAATAGA 

G CC CAGCATGTCC^CACCTCATCATTTT AGGGTGTTATTGGTGGGAGCATCACTCA C 

TTTGTCTGCGGGATCCCGTGTGTAGGTCCCGTGCGTGGCCATCTCGGCCTGGACCTGCTGGGCT 

G TTGTACCAGATGGTGCAGGTCCGGGATG AGGTCG CCAGGCCCTCAGTGAGCTGG ATGTGCAGTGTCCGG ATGGTG CACG 
TCTGGGATGAGGTCGCCAGGCCCTGCTGTGAGCTGGATGTGTGGTGTCTGGA 
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GCCCTCGGTGAG CTGG AGGTATGGAGTCCGG ATG ATGCAGGTCCGGGGTGAGGTCG CCAGGCCCTGCTGTG AGCTGGATG 
TGTGGTGTCTGGATGGTGCAGGTCAGGGGTGAGGTCTCCAGGCCCTCGGTAAGCTGGAGGTATC 
GGTCCGGGGTGAGK5TCGCCAGGCCCTGCTGTGAGCTGGATGTGTGGTGTCTGGATGGTGCA 
AGGCCCTGCGGTGAGCTGGGTGTGCX^TGTCTGGATGGTGCAGGTCTGG 

GGTGAG CTGG ATATG CGGTGTC CGGATGGTGCAGGTCTGGGGTG AGGTTG CCAGGCCCTGCTGTGAGTTGGATGTGrGGGT 

GTCCGGATGCTGCAGGTCCGGTGTGAGGTCACCAGGCCCTGCTGTGAGCTGGATGTGTGGTC 

GGGGTGAAGGTCGCCAGGCCCCTGCTTGTGAGCTGGATGTGTGGTGTCTGGATGGTC 

GCCCTCGGTGAGCTGGATGTGCAGTGTCCAGATGGTGCAGGTCCGGGGTGA 

TGCGGTGTCTGGATGGTGCAGGTCTGGAGTGAGGTCGCCAGGCCCTCGGTGAGCTGG 

GGTCCGGGGTGAGGTCGCCAGACCCTGCTGTGAGCTGGATGTGCGGTGTCTGGATG^ 

AGACC CTG CTGTG AGCTGGATATGCGGTGTCCGG ATGGTG CAGGTCAGGGGTGAGGTCTCCAGGCCCTCGGTG AG CTGGA 
GGTATGGAGTCCGGATGATGCAGGTCCGGGGTG AGGTCG CCAGGCCCTG CTGTG AACTGGATGTG CGG CGTCTGG ATGGT 
GCAGGTCTGGGGTGTGGTCGCCAGGCC CTCGGTGAG CTGGAGGTATGGAGT CCGGATGATGCAGGT CCGGGGTG AGGTCG 
CCAGGCCCTG CTGTGAGCTGGATGTGCGGCGTCTGGATGGTGCAGGTCTGGGGTGTGGTM 

G AGGT ATGG AGTCCGGATG ATGCAGGTCCGGGGTG AGGTTG CCAGGCCCTG CTGTG AG CTGG ATGTG CTGTAT CCGG ATG 

GTGCAGTCCGGGGTGAGGTCGCCAGGCCCTGCTGTGAGCJTGGATGTGCTGTATCCGGATGGTGCAG 

CACCAGGCCCTGCGGTGAGCTGGTTGTGCGGTGTCCGGTTGCTGCAGGTCCGGGGTGAGTTCGCCAGGCCCTCGGTGAGC 

TGGATGTGCGGTGTCCCCGTGTCCGGATGGTGCAGGTCCAGGGTGAGGTCGCTAGGCCCTTGGTGGGCTGGATGTGCCGT 

GTCCGGATGGTGCAGGTCTGGGGTGAGGTCGCCAGGCCTTTGGTGAGCTGGATGTGC^GTGTCTGCATGGTGCAGGTCTG 

GGGTGAGGTCGCCAGGCCCTTGGTGGGCTGGATGTGTGGTGTCCGGATGGTGCAGGTCCGGCGTGAGGTCGCCAGGCC 

GCTGTG AG CTGGATGTGCGGTGTCTGGATGGTG CAGGTCCGGGGTGAGGTAGCCAAGGCCTTCGGTGAG CTGGATGTGGG 

GTGTCCGGATGGTGCAGGTCCGGGGTGAGGTCGCCAGGCCCTGCGGTTAGCTGGATATGCGGTGTCCGGATGGTGCAGGT 

CCGGGGTG AGGTCACCAGGCCCTGCGGTTAGCTGGATGTGCGGTGTCTGGATGGTG CAGGTCCGGGGTGAGGT CG CCAGG 

ccctgctgtgagctggatgtgctgtatccgx3atggtgcaggtccggggtgaggtcg ccaggccctg cagtg ag ctgg atg 
tg ctgtatccgg atggtgcaggtctgg cgtgaggtcg ccaggcc ctgcggttagctggatatgcggtgtcgg atggtg ca 
ggtccggggtgaggtcaccaggccctgcggttagctggatgtgc^ 

AGG CCCTG CTGTG AGCTGGATGTG CTGTATCCGGATGGTG CAGGTCCGGGGTGAGGTCGCCAGGCCCTGCGGTG AG CTGG 

ATGTG CTGTATCCGGATGGTGCAGGTCTGGCGTG AGGT CG CCAGGCCCTG CGGTG AG CTGGATGTG CAGTGTACGG ATGG 

TGCAGGTCCGGGGTGAGGTCGCCAGGCCCTGCGGTGGGCTGTATGTGTGTTGTCTGG ATGGTG CAGGTCCGGGGTG 

CGCCAGGCCCTGCGGTGAGCTGGATGTGTGGTGTCTGGATGCTGCAGGTCCGGGGTGAGTTCGCCAGGC 

TGGATATG CGGTGTCCCCGTGTCCGAATGGTGCAGGTC CAGGGTGAGGTCG C CAGGCCCTTGGTGGGCTGGATG TG CCGT 

GTCCGGATGGTGCAGGTCTGGGGTGAGGTCG CCAGG CCCTTGGTGAGCTGGATGTGCGGTC 

GGGTGAGGTCACCAGGCCCTCGGTGATCTGGATGTGGCATGTCCTTCTCGTTTAAG 



Intron 3 (SEQ ID NO 6) 

GTACTGTATCCCCACGCCAGGCCTCTGCITCTCGAAGTCCTGGAACACCAGCCCGGCCT 

TGCCTGTGCTTCCCTGGCTGTGCAGCTCTGGGCTGGGAGCCAGGGGCCCCGTCACAGGCCTGGTCCAAGTGGATTCTG 
CAAGG CT CTG ACTG C CTGG AG CT CACG TT CT CTT ACTTGT AAAAT CAGG AG TTTGTGCCAAG TGG TCT CT AGGG TTTG T A 
AAGCAGAAGGGATTTAAATTAGATGGAAACACTACCACTAGCCTCCTTGCCTTTCCCTC 
TCTCri"l"X w r r rrri 'C w rrrri"lX j AGATGGAGTCTCACTCTGTTGCCCftGGOT 
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GCAACCTCCACCTCCTGGGTTTAAGCGATTCA^ 

GCCTGGCTAATTITTCTACTTTTAGGAGAGACGGGOT ~ 
TGATCCACCCACCTTGGCCTCCCAAAGTGCTGGGTTTACA 
CATGCTGTTCTGTATGAATCTTCAATCTATTGGATTTAGGTCATGAGAGGATA 
CAGGG AG CACCTGTGCAGGGAGCACCTGGGGATAGGAGAGTTCCACCATGAGCTAAC 

G CTG TG AGATTT TGT C TG CAATGTT CGG CTG ATG AG AG TGTGAGATTGTG ACAGATTCAAG CTGG ATTTG CAT CAGTG AG 
GGACGGGAGCGCTGGTCTGGGAGATGCCAGCCTGGCTGAGCCCAGGCCATGGTATTAGCTTCTTC 
TGACTGTGGAGGGCTTTAGTCAGAAGATCAGGGCTTCCCCAGCTCCCCTGCACACTCGAGTCCCTGGG 
ACCCCATGCCCCAAATOVGGATGTCTGCAGAGGGAGCTGGCAG 

G ACCCCGACGTGGTGCTGGGGCCATTTCCTTG CATCTGGGGG AGGGTCAGGG CTTTCCCTGTGGGAACAAGTT AATACAC 
AATGCAC CTTACTTAGACTTTACACGTATTTAATGGTGTG CG ACCCAACATGGTCATTTGACCAGTATTTTGG AAAGAAT 
TTAATTGGGGTGACCGGAAGGAG CAG ACAGACGTGGTGGTCCCCAAGATG CTCCTTGTCACTACTGGG ACTGTTGTTCTG 
CCTGGGGGGCCTTGGAGGCCCCTCCTCCCTGGACAGGGTACCGTGCCTTTTCTACTCT 
AGGGCACCAGCTCCGGAGCACCCGCGGCCCCAGTGTCCACGGAGTGC 
GTGGCCGCTCC^GCCCCOSTGCCCCCATGGGTGGTTTTGGGGGAAAAGGCCAAGGGCAG 

C TCATG AG AG CTG ATTCTG CT CCTTGG CTGAGCTG C CCTG AG CAG CCT CT C CCG CC CT CTCCAT CTG AAGGGATG TGG CT 
CTTTCTACCTCGGGGTCCTGCCTGGGGCCAGCCTTGGGCT^ 

AGGGGCATGGGTTCACGTGG CCC CAGATGCAGCCTGGGACCAGGCTCCCTGGTGCTG ATGGTGGGACAGT CACCCTGGGG 

GTTGAC CGCCGG ACTGGGCGTCCCCAGGGTTGACTATAGGACCAGGTGTCCAGGTGCCCTG CAAGTAG AGGGG CTCTCAG 

AGGCGTCTCGCTGGCATGGGTGGACGTCK3CCCCGGGCATGGCCT 

TGAGTCC^TGGGGGCTTGTGGCTTCCCGTGAGCTTCCCCCTAGTCTG 

CTATTGCAG 

Intron 4 (SEQ ID NO 7) 

GTGGCTGTCCTTTGGTTTAACTTCCTTTTTAAACA 

CCCGGAGGAGGGGCCACGGGACACAGCCAGGGCCATGGCACGGCGCCAACCCATTTGTGCGC^ 
TG CCGGTG CCTCCAGAAAAGCAGCGTCGGGGTGTAGGGGGAGCTCCTGGGGCAG 
CAGCCGGGCCAGGGCCTGGATCCAGCACtWCCCGAGGTC 
TCCGCTTACGGGGCCCGGGGACCAGGCCACGACTGCCAGGAGCCCACCGGGCT 
CTCCTCCACCCCACCCCTGTGGCTGCGGTGGCTGCGGTGAC 

GTGTGG CATGAGG ATCC CGTGTG CAACACACATGCGGC CAGGAAC C CG T TT CAAACAGGG T CTG AG GAAG CTGG G AGGGG 

TTCTAGGTCCCGGGTCTGGGTGGCTCGGGACACTCGGGAGGGG 

TTGGCCGGATCCACTTT-CCTGACTGTCTCCCATGCTGTCCCCGCCAG 

Intron 5 (SEQ ID NO 8) 

GTGGGTCCCGGGGACCCCCGTGAGCAGCCCTGCTGGACCTTC 

G AGGT ACT CCTGGGTGGGCCGCAGGGAGTG CAGGTG ACC CTCTCACTGTTGAGGACACACCTGGCAC CTAGGGTGG AGG C 
CTTCAGCCTTTCCTGCAGCACATGGGGCCGACTGTGCACCCTGACTC 
GATTCCAGTTTCCXjTCAGAGAAGGAACCGCAACGGCTCAG 
GGGTCTCCTGTCCTGAGGCTCAGAGAGGGGACACAGCCCGCCCTG 
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AGTGGGGGACACCGCCAGGCCAGGCCCTG^ 
CTCCACTCACACAG 

5*-Bereich Intron 6 (SEQ ID NO 9) 

GTAAGGTT CACGTGTG ATAGTCGTGTCCAGGATGTGTGTCTCTGGGATATGAATGTGTCTAGAATG CAGTCGTGT CTGTG 
ATG CGTTTCTGTGGTGGAGGTACTTCCATGATTTACACATCTGTG ATATGCGTGTGTGGCACGTGTGTGTCGTGGTG CAT 

TGTGTGTGTCTGTGACACGTGCATGTTCATGCTOTGTGCTGCATGTCrGTGATGTGCCT^ 

GTGTCCGTGACATATCCGTGTCTATGGCATGGGTGTGTC 

GCACCATTGTCCTCACGCTCTCGGGTGCTGGTTTGGGGAGCTCCACATTCA 

GTCCTGTCACAGGGCTGGG CCTTGGAG ACTGTAAG CCAGGTTTG AGAGGAGAGTAGGGATG CTGGTGGTACCTTCCTGG A 

CCCCTGGCACCCCCAGGACCCCAGTCTGGCCTATGCCGGCTCCATGAGATATAGGAAGGCTGATTCAGGCCTCGCT 

GGGACACACTCCTCCCAGAGCGGCCGGGGGCCTTGGGGCTCGGCAGGGGTGAAAGGGGC 

AGTGGTC^TGAGCACGCTGGAGGGGTAAGCCCTCAAAGTCGTGCCAGGCCGGGGTGCAGAGCT 

GCTTCGGTCTGGGGAGAGGCACATGTGGAAACCCACAAGGACCTCTTTCTCTGACTTCTTGAGCT 

3 X -Bereich Intron 6 (SEQ ID NO 10) 

TGTGGGATTGGTTTTCATGTGTGGGATAGGTGGGGATCTGT 

GCGAGCTTTCTTCCTGTAGTGGGTCTGCAGGTGCTCCAACAGCTTTATTG 

CGGGTTTATAGTAAGTCAGGGGTGTGGAGGCCTCCCCTG 

CCTGCTGTGGTGTGTGGCCGGTGGGCAGGGCTTCCAGGCCTCCTTGTGTTCATTGGCC^ 
CCGTCCTTGGAATTCCCCTGCGAGTTGGAGGCTTTCTTTCTTTCTTTT^ 
GTCTCGCTCTTTTTTGCCCAGGCTGGAGTGGTTTGGCGTGATCTTGGCTC^ 
ATTCrCTTGCCTCAGCCTCCCAAGTAGCTGGAATTATAGGCGCCCACCACCATGCTGACTAAii^r 

AGACGAGGTTTCTCCATGTTGGCCAGGCTGGTCTCGAACTCCTGACCTCAGGTGATCCTCCCACCTCGGCCTCCCAAAGT 
GCTGGGATGACAGGTGTGAACCGCCGCGCCCGGCCGAGACTCGCTTCCTGCAGCTTCCGTGAGATCTGCAGCGATAGCTG 
CCTGCAGCCTTGGTGCTGACAACCTCCGTTTTCCTTCTCCAGGTCTCGCTAGGGGTCm 
CAGAAGAGTTTCACGTGTGCTG ATTTCCCGGCTGTTTCCTGCGTAATTGGTC 
TTTCCTTTAGGCTTTGTTTATTGTTGTTTTTCCGGCTCCT 

TCTAAACAAGCATCTGAAGTTGCCGTTTTCCCTCTAAAGCAGGGATCCCGAGGCCCCTGG CTGTG 

GGGGCCTGTTAGGAACCCGGCGCACAGCGGGAGGCTAGGTGGGGTGTGGGGAGCCAGCGTTCCCGCCTGAG 

TCTCAGATCAGCAGTGGCATGCGGTGCTCAGAGGCGCACACACCCTACTCAGA^ 

GTGCTCCTTATGGGAATCTAATGC CTG ATGATCTG AGGTGGAACCG C C CCACTGCTG 

TCCTCTGGAAAAATCGTCTTCCACGAAACCAGTCCCTGGTACCACAATGGTTGGGGA 

GCAGCCTCTCGT CAGTGTTG ATATATTGG CrTTTTCTGTGTTG AGTCCAGAAT AATT ACGG ATTTCTGTC ATGCTT^ C 
CGACCTCAGACCCATGGGCTATTTGTGGGCGTGTTGCCTGCTCCTGGGTTGGGAA 
GTTACTGCCTTCCAGGTTGGTTCTCAGGGTTGAATCGTACTCGA 
GGGGCTGGGGAACATGCTGAAGCACAGAGTCACCGTGCGCGTCTTTTGATG 

TGTTAGTGTGTGTCACGTGCCTG CTCACATCCTGTCITGGGG ACGCAGGGG CTT AGCAGGTCCCGTAGTAAATGACAAG C 
GTCCTGGGGGAGTCTGC^GAATAGGAGGTGGGGGTGCCGGTCTCTCTCCCGCGTCTTCAGACTCTTCT 
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GTGGCTC CACCTGCATCCCTGCAATCCCTCCAGCACTGGGCTG 
GACTGTGGATGGCAGTCCGTCACGGGGGTCIXjATGTGTGGTGACTGT^ 

GTGACTGTGGATGGCGGTCGTGGGGTCTGATGTGGTGACTGTGGATGGCGGTCGTGGGGTCTGATGTGTGGTGACTGTGG 
ATGGCGGTCGTGGGGTCTGATGTGGTGACTGTGGATGGCGGTCGTGGGGTCTGATGTGGTGACTGTGG 
5 GGGTCTGATGTGGTGACTGTGGATGGCAGTCGTGGGGTCTGATGTGTGGT^^ 

TGGTGACTGTGGATGGCAGTCGTGGGGTCTGATGTGTGGTGACTGTGGATGGCGGTCGTGGGGTCTGATG 
GTGGATGGCGGTCGTGGGGTCTGATGTGTGGTGACTGTGGATGGCGGTCGTGGGGTCTGATGTGTGGTGACTGTGGATGG 
CGGTCGTGGGGTCTGATGTGGTGACTGTGGATGGCGGTCGTGGGGTCTGATGTGTGGTGACTGTGGATGGTGATCG 
CAGGGGTCTGATGTGTGGTGACTGTGGATGGCGGTCGTGGGGTCTGATGTGTGGTGACTGTG 
1 0 GGGTCTGATCTGTGGTGACTGTGGATGGCGGTCGTGGGGTCTGATC 

TCTGATGTGTGGTGACTGTGGATGGCGATCGGTCACAGGGGTCTGATGTGTGGTGACTC 

GATGTGTGGTGACTGTGGATGGCGGTCGTGGGGTCTGATGTGTGGTGACTGTGGATGGCGGTCGTGGGGTCTGATG 

GACTGTGGATGGCGGTCGTGGGGTCTGATGTGGTGACTGTGGATGGCGGTCGTGGGGTCTGATGTGTGGTGACTGTGGAT 

GGCGGTTGGTCCCGGGGGTCTGATGTGTGGTGACTGTGGATGGCGGTCGTGGGGTCTGATGTGGTGACTGTGGATGGCAG 

15 TCGTGG GGTCTG ATGTGTGGTGACTGTGG ATGGCGGTCGTGGGGTCTG ATGTGTGGTG ACTGTGGATGG CGG TCGTGGGG 

T CTG ATG TGTGGTG ACTGTGGATGGCGGTCGTGGGGTCTGATGTGTGGTG ACTGTGGATGGCGGT CGTGGGG TCTGATGT 
GGTG ACTGTGGATGG CGGTCGTGGGGTCTGATGTGTGGTGACTGTGGATGGTGATCGGTCACAGGGGTCTGATG TGTGGT 
GACTGTGGATGGCGGTCGTGGGGTCTGATGTGTGGTGACTGTGGATGGCGGTCGTGGGGTCTGATGTGG 
GGCGGTCGTGGGGTCTGATGTGTGGTGACTGTGGATGGCGGTCGTAGGGTCTGATGTGTGGTGACTGTGGATGGCAGTCG 

20 GTCACAGGGGTCTG ATGTGTGGTG ACTGTGGATGG CGGTCGTGGGGTCTGATGTGTGGTGACTGTGGATGG CGGTCGTGG 

GGTCTGATGTGTGGTGACTGTGGATGGCGGTCGTGGGGTCTGATGTGTGGTGACTGTGGATGGCGGTCGTGGGGTC 
GTGGTGACTGTGGATGGTGATCGGTCACAGGGGTCTG ATGTGTGGTAG CTG CAGGTGGAGTCCCAGGTGTGT CTGTAG CT 
ACTTTGCGTCCTCGGCCCCCCGGCCCCCGTTTCCCAAACAGAA 

GGCTTGGCCGCAGGTCCACACGTCCrGATCGGAAGAAACAAGTGCCCAGCTCTGGCTCG 
25 ATGCCCTCTCCTCTGCCGGCAG 

Intron 7 (SEQ ID NO 11) 

GTCTGGGCACTGCCCTGCAGGGTTGGGCACGGACTCCCAGCAGTGGGTCCT 

G ACAG ACTGTTGG CCCTGGGGGGCAGTGGGGGGAATGAG CTGTGATGGGGGCATG ATGAG CTGTG TG CCTTGGCGAAATC 
3 0 TGAGCTGGGCCATGCCAGGCTGCGACAGCTGCTGCATTCAGGCACCTGCT 

Ca3CAGTGCCTTTGTTCATGATTTGCTAAATGTCT^ 

CCTTTAGGAGGGCAGGCCATGTTTGAGCCGTGTCCTGCCCA^ 

TGTCCCCCTTCTrAGGAGGACGGGCCGTGTTTGAGCCACGCCCCG 

GGCCCTGTGGCCCTTTGCAGATGTGGTCTGTCCACGTGGCCCTGTGG CTCT 
3 5 TCTAGGGGACAGTCGTGTCCACCGCATGAGGCTCAGAGACCTCTGGGCGAATTTCCTTGGCTCCCA 

GTGGCCTGGGCTGCTGGGACCCAGACCCTGTGCCCGGCAGCTGGGCAGCAACTCCTGGAT 

CGGTGGGCTGTGTGGGTGTGAGCCCAGCTGGACCCACAGGTGGCCCAGAGGAGACGTTCTGTGTCACACACTCTG 
GCCCATGTGTGTCTGCAGAGACTCGGCCCGGCCAGCCCACGATG^ 
AACACTGACCCCAAAAGGGACGGAGGGTCTTGGCCACGTGGTCCTGCCTGTCT 
40 TCTCCCGTCTGCTTTCGCAG 
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Intron 8 (SEQ ID NO 12) 

GTGAGTCAGGTGGCCAGGTGCCATTGCCCTGCGGGTGGCTGGG 

CTTCCCCACTGNCCTTCTGCCCGGGGCCACCAGAGTCTCCTTTTCTGGCCCCCGCCCCCTCCGGCT 
5 TCCCGAGGCC CCGGAAACATGG CTCGGCTTGCGGCAG CCGGAGCGGAGCAGGTGCCACACGAGG CCTGGAAATGGC AAGC 

GGGGTGTGGAGTTGCTCCTGCGTGGAGGACGAGGGGCGGGGGGTGTCT 

G CAG CTTGTCAGCTCCAAGTTACTACTGACGCTGGACACC CGGCTCTCACACGCTTGTATCTCT 

GGATTTTATCCGATTCTCATTCCTGTCCCTGTCGTGTG ACCCCCG CGAGGG CG CGGGCTCTTCTCTCTGTGACTAG ATTT 
CCCATCTGGAAAGTGCGGGGTTGACCGTGTAGTTTGCTCCTCrCGGG^ 

10 GAGAGCTGCCGTCACACAGCCACTGGGTGAGCCACACTCACGGTGGTAGAGCCACAGTGC 
CTGGATTTTAAGTAAAACCACACACCTCCCGGCAGGCATCTGCCTGCGACCCTGTGTGTG 
GGAGGAAATTCGTGCACACTCAAG^TCATCAGCAAGGTCTVTCCGCAGTCAGGTGGAACG 
G TCT CCAGCGG ATAAAGGACTGTGCACAGCTTCGG AAGCTTTTATTTAAAAAT ATAACTATTAA 
AATCACTAATGGTATCAGCAATTATAATATTTATTAAAGTATAATTAGAAATATTAAGTAGTACACACGT 

1 5 CACAAATTGCACATGGCAGCAGAGTGAATTTTGGCCGAGGGACA 

AGAATTCGCTGACAAAGTCACCTCCCCAGAGAAGCCACCACGGGCCTCCTTCGTGGTCGTGAATTTTA^ 

AAGT CACGT ACCGT CCACGTGTGG CAGGGCTTTGGGG AATGTGAGGTGATG ACTGCGTCCTCATGCCCTGAC^G ACAGG A 

GGTGACTGTGTCTGTCCTGTCCCTAGGACACGGACAGCCCCGAAGCTCTA^ 

ATAAAAACGTCTTCAAAACCTGTTGCCCCAAAAACTAAG AACAGAGAG AGTTTCCCATCCCATG 

20 TCTGCTTGCGTTGACTCGCTGGGCTGGCCGGACTCCTAGA 

G CCCATCACTGTGATATCTG CACCAGCAAGGAAAGCCT C T' rrrC ' l '' lT TCTTTC r i l l"l"l"l"l " l"l " l " l'TGAGACGGAACGTCA 
CTGTTGTCTGCCTGGGCTTGAGTGCAGTGGCGCGATCTCAA 

CTG C CT CAG C CT CC CG AG CAG CTG AG ATT ACAGG CAC C CAC C C CCTGCG C CTGG CT AATTTTTG T ATTTTT AG T AG AG AG 
GGGTTT TTGCCATGTTGGCCAGGCTGGTCTCGAACTCCTGACCTCAGGTGATCCACCCACCTCGG CCTCCCAAAGTGCTG 
25 GG ATT ACAGGTGTGAGCCATCACG CCCAGCCGGAAAGCCTCTTTTTAAGGTGACCACCT CTTCCCGAAAATAAC 

aggtcttgtttttgcagtaggctg caagcgtctcttag caacaggagtgg cgtcctgtggg ctctgggg atgg ctg aggg 
tcgcgtggcagccatgccttctgtgtgcacctttaggttccacggggcta 

CCCTTGGCATCCTTGTTTGGAGAGTTTCTGCTTCTCGTTGGTC^ 

gcagcggctacatgtagggtcatgagtctttcaccgtggacaaatt^ 
30 tcattccgggtgaagtgtctggttctgtgaataaact 

AG AG caaggatgtggtcacacctgtgg ctggatctgtttcagccgccccagtgcatggtg ag agtgggg agcaggg attg 

tttgttcagaggtctcatctggtatgtttctoaggtgtttgccggctgaatc 

tctgtgtctgtgtoiwctcggtttgagtgtaot 

CCCAG 

35 

Intron 9 (SEQ ID NO 13) 

gtgaggcctcctcttccccaggggggcttgggt<xk5ggttgatttgcttttgatc 
tctggagaccatgactg ctctgtcttg aggaaccagacaaggttgcagccc cttcxtggt^ 
ttgcacagcctcaggactgccggctccacgcaggctctgtccagcggccatc 
40 gagggccgctoccctgc^tgatgagcatgtcaattca^ 
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CGTTAGGGTCCTTGGGGAGATGGGGCTGGTGCAGCCTGAGGCCCCACATCTCCOVGCAGGCCCTCGAC^ 
CTGGGCGCCTCTTCAGCCCATTGCCCATCCCACTTG CATGGGGTCTACACCCAAGGACG CACACACCTAAAT ATCGTG CC 
AAC CT AATGTGGTTCAACT CAGCTGG CTTTT ATTG ACAG CAGTTACTTTTTTT TTTTTAATACTTT AAGT T CT AGGGT AC 
ATGTGCACGACGTGCAGGTTAGTTACATATGTATACATGTGCCATGTTGGTGTGCTGCACCCATTAACT 
TTAGGTATATCTCCTAATG CTATCCCTCCCCACTCCCCCCATCCCATGACAGG CCCTGGTGTGTGATGTTCCCCACCCTG 
TGTCCAAGTGTTCTCATTGTTCAGTTCCCACCTC 

G CT CAG AGTG ATGGTTTCCAGCTTCGTCCATGTCCCTACAAAGGACATGAACTCATCCTTT^ CAT AGTATT 

CCGTGGTGTATATGTQCCACATTTTCTTAATCCAGTCTATCATCGATGGACATTTG 

GTGAATAGTGCCGCAATAAACATACGTGTGCATGTGTCTTTATAGCAGCATC 

T AATGGG ATGGCTGGG T CAAATGG T ATTT CT AGTT CTAGATC CTTG AGG AAT CAC CACACTGTCTT CCACAATG G TTG AA 
CT AG TTT ACACT C CCAC CAACAGTGT AAAAGTGTT CTGGTG CTGG AG AGG ATGT<3G ACA CAG TT AT TTTTTT AT G AAAA 
TAGTATCACTGAACAAGCAGACAGTTAGTGAAGGATGCGTCAGGAAGCCTGCA^ 

TC CG GGTTTTT C CTG TG CAT CTTTTG AAACTCT AG CTCCAATTAT AG CATG T ACAGTGG ATCAAGG TT CTT CTT C ATTAA 

GGTTCAAGTTCTAGATTGAAATAAGTTTATGTAACAGAAACAAAAATTTCTTGTACAC^ 

GG AAAGTGTCCTOlAGCTGGCGGCACACrcGTCAGCCCrCTGGGACAG 

G CTTGGG CCTG AGGGTCACACAGTGCACCATG CCCAGCTTCCTGTGGAT AGG AT CTGGGTCTCGGATCATG CTG AGG ACC 

ACAGCTGCCATGCTGGTAAAGGGCACCACGTGGCTCAGAGGGGGCGAGGTTCCCAGCCCCAG 

TTATTTTTCCCTAAGAGTCTGAGAAGTGGGGCCGCGCCTGATC^CCTTCGTC 

G CTGATGGT AAACACTGAGTACTTAT AATGAATGAGGAATTG CTGTAG CAGTTAACTGTAG AG AGCTCGTCTGTTGG AAA 
G AAATTT AAG TTTTT CATTTAAC CG CTTTGG AG AATGTT AC TTT ATTT ATGG CTG TGT AAATTG TTTG ACAT T C AG T C C C 
TCGTAGACAGATACTACGTAAAAAGTGTAAAGTTAACCTTGCTGTGTATTTTCCCrTATTT^ 

Intron 10 (SEQ ID NO 14) 

GTGAGGCCCGTCCCGTCTGTCTCTGGGGACCTCGACAGCCTC 
CACCGCAGCGTTGTCTCTGCCAAGTCCTCTCTCTC^ 

CAGGCCTGGGGGCGCAGGCXSCACCrrCGGGAGGGAGTCGGTACCGTGCAGGCCCTGGTCCT^ 
ACACACGTGGTGAGTGCAGGCGGTGACCTGGCTC CTG CTG CTCTTTGGAAAGTC^ 
TGAGACCCCCAGGAGCTGTCCACAGGGCCTCCAGGGCOSAGGCGGCAGCCT 
GAGCAGGAGCTGCTGAGTGAGCT<3GCCCACAGCGTTCGCTGCG<5TCACGTTCCTGCGT 
AGAATTTCGATTTGCTCAGTGCTGCTGTCT^ 

GAAACTAAAATCAGGCACAGGGGAC CTGGCCTCAGCACAGGGGATTGTC CAATGTGGTCC CCCTCAAGGGCG CC CCACAG 
AGCOMTGGGCTTCT^TTAAAGTCCGATTTGACGAGGGACGAGAAAC 

TCCAGGTCCACCCTCCAGGGCa3CCCTGGGCTGGGGGTATGCCTCK3CGTTCCT^ 
TGTGCACATTTAAATCCACTAAGAT^CACTCGGGGGGAGCCCAGGTCC 

G CTG AGG GG ACAG AGCAG ACGGGG AACG CTG CTT CTGTGTGG CAAG TT CCTG AGGG TG CTGG CCAGGGAGGTGG CT CAG A 

G TGT ATG TTGGGG T C C CA C CGGGGG CAG AACTCTGT CTCTG ATG AGT CGG CAG CC ATG T AACAGG AAGGGGTGG C CA CAG 

GGAGCTGGGAATGCACCAGGGGAGCTGCGCAGCrcGCCGAGGTCCC^ 

GGGGCCACAGCAGAGGCCGCAGGAAGCX3AAGGGGATGCCCACX3CCAGA^ 

AG CTGGGTG AGCG AGGCTCATGACTCGGCG AGGGAACCTCCTTG ACXITGAAGCT 
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CCCAGCCAGGTCCCGCGCCTGAGCAGGAACTCAGAACCCTCC 

AGGAGAAAACAGGCAAAGTCGTTGAGAAACGTCTTAAAAGAAGGTGGGATGGTGGCAATTTCTTGTCC^ 
GCCCCGGACCACAGATGAGTCTATAACGGGATTGTGGTGTTGCCATGGGGACACATGAGATGGACCATCACAGAGG 
TGGGGCTGCACCTCCCATCTGAGTCCTGGCTGTCCCGGGTCCAGGCCAGGTTCTTGCATGCT 
5 GGGAGACAGGGAAAGCACCCCGAAGTCTGGAGCAGGGCTGGGTCCAGGCT 
GCTCCAAATCACCACTTCTCTGGGGTTTTCCAAAGCATTTA 
TCCTGGGGCTGACATTGCCCCTCTGCCTTAG 

Intron 11 (SEQ ID NO 15) 

10 GTGAG CG CACCTGGCCGGAAGTGGAGCCTGTGCCCGG CTGGGGCAGGTGCTGCTGCAGGGCCGTTGCGTCCACCTCTG CT 

tccgtgtggggcagg cgactgccaatcccaaagggtcagaggccacagggtg cccctcgtcccatctgggg ctg ag caga 
aatgcatctttctgtgggagtgagggtgctcacaacgggagcagttttctc 

cagacctgggtgcactgaggtgtcttcagaaagcagtctggatccgaacccaagacgcccgggccctgctg^ 
ctctcaaaccccaacacaggcgccctgctgggcatgagtccctct 
15 ctctccgaacccagagacitcagggcccttttgggcgtgag 

agt ct acagg atg c catg agttcatg atcacgtg tg acccat caggggacaggg cc atgg tg tgggggggg t ct ct acaa 
aattctggggtcttcttrccccagagcccgagagctcaaggccccgtctcaggct 

cacag atg gag aaatctgtg ctg tttctttt atgaat aaaaagt at caacatt^ cagg g caaggtgg ct cacacct 
ataatcccagcactttgggaggccgaggtgggtggatcacttgaggccaggagtttga 
20 aaattccatttctacrtaaaaaatacaaaaattagcctggcctc^ 

tg aggcaggagaatcatttg aacccaggaggcagaggttg cagtg agccg ag atcacac cactg cactccagcctgggca 
acagagtcagacttcatcttaaaaaaaaaaaaaaaagtatcagcattccaa 

tgtccttcgataatatttactggtgctgtgctagaggccggaactgggggtgccttcctctgaaaggcacac 
gaagagaaataagt<wtgaatggttgttaaaccagaggtttaa^ 

2 5 tggactttgcctctttccagaatgctccctggggtttgcttcatgg 

gagcagcaggtgcagacgccctcatgatgggggagtgg(^ggtgcagacacccttg 

ttgcag ctccctccccacaaggatgccggtctcctgtg ctccccacagtccctg cttccctctcacag ccttacctggtc 

ctggcctccactggctttgtctgcatgatttccacat 

gcagtgctggccataccagtcagctgtgaactgtccac^ 

3 0 acccctggttccagcctctcgcacagcatcagtgaatc 

gttctctctaaacacattggaaagc cacag aggctagtc 
ccagaatattctgtgctcccaaag<5ccacttggtcagagtgtgtgctt 
gcagtggttok:catactc»gggtgaactcacatcctctgtgt 
gaagaaaacaggcaaaatgattaagaaaagtgaaaaaggaaa^ 
3 5 tcccaaaccacagctcagatggtagaatgtggtcagaacigat^ 

cagaaacgtgtgttaatgtggt atgtgg cacag ctgatggaaaagagagtgtgtgtgtaatttttttttctg ag aaaact 
g actgg aagcaaataagttgtgtctttacagcatatac cag ag cag attctaggtagaagaggag acacatg caaacaac 
accaggaacagaaataaaacaaaagactcaaac^jgaagggaggtga^ 

agggaggcggatgjuvaccagtgaggcaacgggcattgctttcactgcagagaaactcagcttgcctgag 
40 atggccattccctggagcgtttgtgcacgtgatttatttaaggcx3ccc 
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GTTCTCCTAACCACCTGAGAGGTAGAGGA^ 

ATGCATGATTG CAGCCTGG CCT C CTG CTCCGGGGC C CTTG CT CTG CC CGAGG ACC C CACACAAG T CAG ACC CATAGG CTC 
AGGGTGAGCCGGAGCCCAAGGTCGTGTTGGGGATGGCTGTGAAA^ 

CT ACCAG CAG CG T CAAAG AAATG CATG TG AAACTG ACAG CG AGAC CCAT C CCTCAAAGAAACG CACGTG AAACTG ATGG C 
5 G AG ACCTGTCCCCATCCCTCATGCTGGCTCCTTTTCTGGG CTTGCCAAGAG CCAG CATCAGGTTGAGGCAAGCTGGAAAG 

ACTTTTCTGGAAAGCAGCTTGTTTG CATGGAAGTCCTCACAATGTCCTGTGTCTTC CCAGTAATTCCACTTCTG AAGTG a 

C CAG ACAT TAT CACGGG T CTT ATTT AC CATTT C CAGTGTTC CAGGCAGGGGG ACTTG CCACAG CAAGT CACG AAC CTG C C 

CAAATACAGGGCTAAGGAGATATTATGCATCACAAAACTTC 

GTTTAATC^CAGAAAACGTTTATTTCAATGTAGCAGTGTTC^ 
1 0 TGAATGTCATGTGTGTTCATCTTTGGACATGGACATACATGGGCAGTC 

GATGCCTCCATCCTGCCCCTCTGGAGACACCATGTC^ 

G CTCTTC CAT CC CTTG AG ATTCAAACACAGTG AG ATT CCCCAC^ 

ACCTGTGTTCACTCGAGGGACGCCCGGGAGCCAGGGCTCCACAGTTTA^ 

TCATC^GGCAGATGATGAGTGCACAAACACGGCCGTGCGAGGTTTGGATAC^ 
1 5 GAGTTTGGTCATCCAGAGTCTGGATGGCATCTAGCATTTGGAGTCCAT 

G CATG CCC CAGG CAGGACAAGGAAGCGGGAGG AAGG CAGGAGGCTCTTTGGAGCAAG CTTTC 

GGGGCAGGCACCTCTGTCTGACATTCCCCCCTGTGTCTCAG 

Intron 12 (SEQ ID NO 16) 

20 G TGAGCAGGCTG ATGGTCAGCACAG AGTTCAGAGTTCAGGAGGTGTGTGCG CAAGTATGTGTGTGTGTGTGTGCG CG CGT 

G C CTG CAAGG CTG ATGGTG ACTGG CTG CACG T AAG AGTG CACATGT ACG CAT ATACACGTG AG CACAT ACATGTGTG CAT 
GTGTGTACATG AAGG CATGG CAGTGTG TG CACAGGTGTGCAAGGGCACAAGTGTGTGCACATGCGAATG CACACCTG ACA 
TGC^TGTGTGTTCGTGCACAGTCGTGTGGGCATTCACGTGAGGTGCATG 

G CACAT AACATGTATTGAGGGGTCCTCGTGTTCACCCCG CTAGGTC CTCAG CACCAGTG CCACTCCTTACAGG ATG AG AC 
2 5 GGGGTCCCAGGCCTTCGTGGGCTGAGGCTCTGAAGCTCCAGCCCT 

CCCTCTCCTGTGGGCTTCTGTGTCCACTCCCCCTCTCCTGTGGGCATTTACATCCACT 

ATCCGCGTCCACTCCCCCTCTCTGTGGGCATCTCCGTCCACCTCCCCrCTCT 

GGTTCCTTCCTGTCTTGGCCGAGCCTCGGGGGCAGGCAGATGACACAGAGTCT^ 

CCGGGTGAGGGCCAGGCCGGATTTCACTGGGAAGAGGGATAGTTTCTTGTCAAAATGTT 
30 ATC^ATGATAAAGCAAAAAGTAAAAACTTAAAATCCCAGAGAC^TTTCTACCG 

Intron 13 (SEQ ID NO 17) 

GTGAGCCGCCACCAAGGGGTGCAGGCCCAGCCTCCAGGGACCCTC 

TGGAACTCCTGGGTTTTAGGGGCAAGGAATGTCTTACGTTTTCAGTGGTGCT 
35 GCTCTGTGCAAAGCACCTGTTCTCCATCTCTGGGTAGTGGTAGGAGCCGGTG 

G CACTGG CCGTXXK3ACGTCATGG AGGCCATCCCAGGGCAGCAGGGGCATGGGGTAAAG AGATGTTT ATGGGG AGTCTTAG 

CAGAGGAGGCTGGGAAGGTGTCTGAACAGTAGATGGGAGATCAGATGCCCGGAGGATTTGGGGTCTCAGCAA^ 

GAGGTGCCTGCAGGTGAGGGTCGCTGGCCCCACCCCCGGGAAGGTCCAGCAGAG 

GCACCTGTGCTCTGGGC^TGGCTGTGCTCCTGGAACGTTCCCTGTC 
4 0 ACAACTTTATCACAGAGGGAAGGGCCAATCTGTGGAGGCCACAG 
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ACAAGCCTCGGGGCTGTACCAAAGGGCAGTCGGGCACCACAGGCCCG 
GGAGCTGAATGCCAGGAGGCCC^GCCCTCGCCCCATGAGGGCTGAGAA 

AGG CTG CG CGAATT ACCG TGCACACTTG ATGTGAAATG AGGTCGT CGT CT ATCG TGGAAACC CAG CAAGGG CTCACGGG A 
G AGTTTTCCATTACAAGGTCGTACCATGAAAATGGTTTTT AACCCG AGTGCTTG CG CCTTC ATGCTCTGGCAGGG AGGGC 
5 AG AG CCACAG CTGCATGTTACCG CCTTTGCACCAGCTCCAGAGGCTTGGGACCAGG CTGTCTCAGTTCCAGGGTGCGTCC 

GGCTCAGACCGCCCTCCTCTCTGCCTTCTCTCTCTGCCTCAAATCTTCCCTCGTTTGCATCTCCCTGACGCGTGCCTGGG 
CCCTCGTGCAAGCTGCTTGACTCCTTTCCGGAAACCCTTGGGGTGTGCTGGATACAGGTGCCA^ 
CTGACACTGTGGTTGACCCCAGGGTCCMCTGGCGTGCTTGGGGCCTCCTTC 

CAGGTGAAAACTCCTGGGAAACTCCCAGGGCCATGTGACCTGCCACCTGCTCCTCCCATATTCAGCTCA 
1 0 ATTTCCCCACCAGGGTCTCTAGCTCCGAGGAGCTCCCGTAGAGGGCCTGGGCTCAGGGCAGGGCGGCTGAGTTTCCCCAC 
CCATGTGGGGACCCTTGGGTAGTCGCTTGATTGGGTAG CCCTG AGGAGGCCGAG ATG CGATGGG CCACGGGCCGTTTCCA 
AACACAGAGTCAGGCACGTGGAAGGCCCAGGAATCCCCTTCCCTCGAGGCAGGAGTGGGAGAACGGAGAGCTGGGCCCCG 
ATTTCACGGCAGCGAGGCTGCAGTGGGCGAGGCTGTGGTGGTCCACGTGGCGCTGGGGGCGGG 

TGGGGCTCGGCCTTCCTGGCCCGTGCTGGCCGCGCCTCCACACGGGCTTGGGGTGGACGCCCCGACCTCTAGCAGGTGGC 
1 5 TATTTCTCCCTTTGGAAGAGAGCCCCTCACCCATGCTAGGTGTTTCCCTCCTGGGTaVGGAGC^ 

CCGGGACCTT AGGCTTATTTATTTGTTTAAAAACATTCTGGGCCTGGCTTC CGTTGTTG CTAAATGGGGAAAAG ACATCC 
CACCTCAG CAGAGTTACTGAGAGGCTG AAACCGGGGTG CTGGCTTG ACTGGTGTGATCTCAGGTCATTC CAG AAGTGGCT 
CAGG AAGTCAGTOAGACCAGGTACATGGGGGG CTCAGGCAGTGG^ CTCAGGCAGTGGG7 
G AGG C CAGGT ACATGGGGGG CT CAGG CACTGGGTGAG ATG AGGT AC ACGGGGGG CTCAGGCAG AGG G T CAG AC CAGG T AC 
20 ACGGGGGCTCTGATCACACGCACATATGAGCACATGTGCACATGTG 

CCCAAAGTCCCAG<jAAGCTGAGAGGCCAAAGATGGAGGCTGACAGGGCT 

ctttggg agg ccgaggcg agaggatcccttg agc c cagg agtttaag accag c ctg ag caacat agt ag aaccccatctc 

tatgaaaaataaaaacaaaaattagcigaacatggtggtgtgcgcctgtagttccaatacttgot 

g atcacttgag cccaggaggtggaagctgcagtg AG ctgagattgcaccactgtactgcag cctgggtg acag agtgag a 

25 gcccatctcaacaacaacaaagaagactgacaaatgcagtttcttggaaagaa^ 

c^gaagccaagtcggtgtctcggtgtcagtgagatgagatgatgggtcctcacaccatcaccccagacccagggtttatg 
caccacaggggcgggtggctcagaagggatgcgcaggacgttgatatacgatgacatca 
gattcatgataagtacctgctggtacacaaggaacaatgg 
aatcagaagccagcatggggggctggcatccaggatggagctgctt 

3 0 cagaaacgcagtgtacctgtgcacacacagacacgcagctactcgc^ 

atccgtgtgtgtgcacctgtgcccatgaggaaacccatgcatgtgcattcatgcacgcac^ 
gcccacacccacgagcaccgtctgattaggaggcctttcctctgac^ 

Intron 14 (SEQ ID NO 18) 

3 5 gtatgtgcaggtgcctggcct cagtggcagcagtg cctg cctg ctggtgtt agtgtgtcagg AG actg agtgaatctggg 

CTT AGG AAGTTCTTACCCCTTTTCGCAT CAGG AAGTGGTTTAACCCAACCACTGTCAG 

GGGGTG AGCAGAGCACCTG ATGG AAGGGACAGGAG CTGTCTGGG AG CTG C CATCCTTCCCACCTTGCTCTG CCTGGGGAA 
GCGCTGGGGGGCCTGGTCTCTCCTGTTTGCCCCAT^ 
GATTCXXSCTGTCTCCCGTCCATGGCACITAGGGCCCTTGTGCAAACC 
40 GCTACCCCACCCCTCTO^AGCAGAGGCCCCGTATCACCACGA CTTCCCAGTCACCG 
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TCCTCTGCCCCTGGACACTTTGTCCAGCATCAGGGAGGTTTCrGAT 
CCTGAGCTTAACAGCTTCTACTITCTGTTCrTTCTGTGTTGTGG 
TCGTGACTCCTGCGGTGCTTGGGTCGOGACAGCCAGAGATGGA^ 
GTGTCTCCTG<K?AGGGGAGCTGGGCTGGGCCTGTGACTCCTCAGCCTCTGTTT^ 

5 

Intron 15 (WEQ ID NO 19) 

GCAAGTGTGGGTGGAGGCCAGTGCGGGCCCCACCTGCCCAG<^ 

AGATGCTGCTGAAGTGCAGACGCCCCCGGGCCTGACCCTG<X3GGCCTGGAGCCACGCTGGCAG 
CTGGTCTCCCCAGGCCACGGAGCCTGGCAGGGTCCCCAACTTCT 
1 0 CCACGCTTGGGAGCCTTCTGACCCCTGACCTGTGT 

CCTGAGCAAGTTCTCTCCCCGCCCCGCCGCTCCAGCGTCACT^ 

TCCCTTCACTGAGGTTCCCACCAGCCAGGGCCACGAGGTGCAGGCCCTC 

TTGGAGGATGCCACCTCTGGCCTCTTCTGGAACGGAGTCTGATTTTGGCCCCGCAG 

15 3 1 -untranskribierter Bereich (SEQ ID NO 20) 

ATCTCATGTTTGAATCCTAATGTGCACTG CATAGACACCACTGTATGCAATTACAG AAG CCTGTG AGTG AACGGGGTGGT 
GGTCAGTGCGGGCCCATGGCCTGGCTGTGCATTTACGGAAGTCTATGAGTGAATGGGGTTGTGGTCAGTGCGGGCCCATG 
GCCTGGCTGGGCCTGCGAGGTTTCTGATGCTGTGAGGCAGGAGGGGAAGGAGGGTAGGGGATAGACAGTGGGAGCCC 
CCCTGG AAG ACATAACAGTAAGT CCAGGCCCGAAGGG C AGCAGGG ATG CTGGGGG CCCAGCTTGGG CGG CGGGG ATGATG 
20 G AGGG CCTGGCCAGGGTGGCAGGG ATGATGGGGGCCC CAG CTGGGGTGG CAGGGGTG ATGGGGGGGG CTGG TCTGGGTGG 

CGGGGAAGATGGGGAAGCCTGGCTGGGCCCCCTCCTCCCCTGCCrCCCAC^ 
GGTGCACATCCTCTGGGCCATCAGCTTTCATGGAGGTGG^ 

C CT CCT C C TG AACG C C C CAACT CAGG TTG AAAGTCACATTC CGC CTCTGG C CATT CT CTT AAG AGT AG ACCAGG ATT CTG 

ATCTCTGAAGGGTG^TAGGGTGGGGCAGTGGAGGGTGTGGACACAGGAGGCT 
2 5 ATCCTCTTATCATCTCCCAGTCTCATCTCTCATCCTCTTATCATCTCCCAGTCTCATCTGTCT^ CCCAGT 

CTCATCTGT CATCCTCTT ACCATCTCCCAGTCTCATCTCTTAT CCTCTTATCT CCTAGTCTCATCCAGACTTAC CTCC CA 

GGGCGGGTG CCAGGCTCG CAGTGG AGCTGGACATACGTCCTTCCTCAGG CAG AAGGAACTGGAAGG ATTGCAG AGAACAG 

GAGGGGCGG CTCAGAGGGACGCAGTCTTGGGGTGAAGAAACAGCCCCTCCTCAG AAGT^^ C CACACG AAACCG 

AGGGCCCTGCGTCAGTGGCTCCAGAGCCTTCCAGCAGGTCCCTC 
30 CAC CTTGG ACAGGG CTTCTGGTTTG AG TG CAG C C CGG ACG TG C C TGGTGT CGGGG TGGGGG CTT ATGGC CACTGG AT ATG 

GCGTCATTTATTCCTCCTGCTTCAGAGAAT 

TGTCGTAAATGCACTCTCXJTCCCTGGAGCCCCCGTATAGGAGCnSTCAGGA^ 
GC<3CCTTTGCCCTGCAAACTGGAAG-GGAGCGGCCCCGGGCGCC^ 
AC<K3 CGGGG ACITCCCAC^AG CAG AGGCCGCTGCT CAGG CACACC^ 
35 GTTCAGCTATCCATCTTCTACAAAGCTCCAGATTCCTGTTTCTCCC<K3TGTTTT 
TATATTTT^GCTAAAGTATTAGACCCTTAAAAAAG^ 

TTG T CTGTTTTT ATTT ATT ATT ATTATT ATT ATT AG AG ATGG TGT CT ACT C TG T CAC C CAGG TTG TT AG TG C AG TGG CAC 
AGTCATG<3CrCGCTGTAGCCGCAAACCCCCAGGCTCAAGTGATCCTCC^ 
GTGTGAGCCACTGCCCTTGCCTGGCACTTTTAAAAACCACrrATGTAAGGTCAjGGTCCAGTG 
40 CAGTAGTTTGGGAAG CCG AGG CAG AAGGATTGTCTCAGGCCAGG AGTTTGAG ACCAGCATGGGT AAC ATAGGG AGACCCC 
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ATCTCTACAAAAAATGCAAAAAGTTATCCGGGCGT^ 

AGGATCGCTTGAGCCCGGGAGGTCATGGCTGCAGTGAGCTGTGATTGTACCATC 

GACCCTGTCTCAAAAAAAAAAAAAAAAAAAGAAGGAGAAGGAGAAGAGAAGAAGAAGGAAGAAGGAAA^ 
GAAGAAGGAAGAAAGAAGGAGAAGGAGGCCTGCTAGGTGCTAGGTAGACTGTCAAATCTCAGA^ 
5 AAGTTTTAAAGGGAAAGAAAAACCCCAGCTCTTTGGACTTCCTTAGGC 

G ACAAG CGTGTATGG AG CGAGTGAGTTCAAAG CAGAAAGGGAGGAGAAGCAGGCAAGGGTGGAGG CTGTGGGTG ACACCA 
GCCAGGACCCCTGAAAGGGAGTGGTTGTTTTCCTGCCTCAGCCCCACGCTCCTC 
GATGTTGGTGCCAGGTGCCCACCTGGGAAGGATGCTGTGCAGGGGGCTTGCCAAACT 
GCACTTGTGGCAGGCACAATTAGAGCCCCTCCCCAAAGATC 
1 0 CAAGGCAGAGGCTGGTCAAGGCTGCAGGTGGAATCACGGCTGCCAGTCAGCCGAT 

TGGGCCTGATATGGCCACAAGGGTCCCTAGAAGTGAGAGAGGGAGGCAGGGGAGAGTCAGAGAGGGGACGTGAGAAGGAC 
CACTGGCCACTGCTGGCTTTGAGATGGAGGAGGGGGTCCCCAG CCAAGG AATGGGGGCAGCCGCT CCATGCTGGAAAAG C 
AAGCAATCCTCCCCGGTCCTGAGGGCACACGGCCCTGCCCACGCCT 

C GG C CT CCAG AG CTGTAAG ATG ATG CGTTTGTGTT CAG C CACT AAG CTG CAGTG ATT CG T CACAG CAG CAAATG G AAT AG 
1 5 CAGTACAGGGAAATGAATACAGGGACAGTTCTCAGAGTGACTCTCAGCCCACCCCTGGG 
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Die Charakterisierung der Exons zeigte interessanterweise, dafi die in unserer 
Patentanmeldung PCT/EP/98/03469 beschriebenen, funktioneil wichtigen hTC- 
Protein-Dom&nen auf separaten Exons angeordnet sind. Das Telomerase- 
5 charakteristische T-Motiv befindet sich auf Exon 3. Die far die katalytische Funktion 
der Telomerase wichtigen RT (Reverse-Transkriptase)-Motive 1-7 liegen auf 
folgenden Exons: RT Motiv 1 und 2 auf Exon 4, RT Motiv 4 auf Exon 9, RT Motiv 5 
auf Exon 10, RT Motiv 6 und 7 auf Exon 1 1. RT Motiv 3 liegt verteilt auf Exon 5 
und 6 vor (s. Fig. 8). 

10 

Die Aufklarung der Exon-Intron-Struktur des hTC-Gens zeigt auch, dafi die in 
unserer Patentanmeldung PCT/EP/98/03469 beschriebenen vier Deletions- bzw. 
Insertions-Varianten der hTC-cDNA ebenso wie drei weitere, in der Literatur (Kilian 
et al., 1997) beschriebene hTC-Insertions- Varianten hochstwahrscheinlich alternative 
15 Splice-Produkte darstellen. Wie in Fig. 8 gezeigt, lassen sich die Splice Varianten in 
zwei Gruppen einteilen: Deletions varianten und Insertionsvarianten. 

Den hTC-Varianten der Deletionsgruppe fehlen spezifische Sequenzabschnitte. Die 
36 bp in frame Deletion in Variante DELI resultiert hochstwahrscheinlich aus der 

20 Benutzung einer aiternativen 3'-Splice Akzeptorsequenz in Exon 6, wodurch ein Teil 
des RT Motivs 3 verlorengeht. In Variante DEL2 vverden die normalen 5 '-Splice 
Donor- und 3* -Splice- Akzeptor Sequenzen von Intron 6, 7 und 8 nicht benutzt. 
Stattdessen wird Exon 6 direkt an Exon 9 fusioniert, wodurch eine Verschiebung des 
offenen Leserahmens entsteht und in Exon 10 ein Stopcodon auftritt. Variante Del3 

25 stellt eine Kombination aus Variante 1 und 2 dar. 

Die Gruppe der Insertions-Varianten zeichnet sich durch die Insertion von 
Intronsequenzen aus, die zu vorzeitigen Translationsstop fiihren. Anstelle der 
normalerweise benutzten 5*-Splice Donorsequenz von Intron 5 wird eine alternative, 
30 3 4 -lokalisierte Splicestelle in Variante INS1 benutzt, wodurch eine Insertion der 
ersten 38 bp aus Intron 4 zwischen Exon 4 und Exon 5 entsteht. Ebenso resultiert die 
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Insertion eines Intron 1 1-Sequenzbereichs in Variante INS2 aus der Benutzung einer 
alternativen S'-Splice Donorsequenz in Intron 1 1. Da diese Variante in der Literatur 
(Kilian et al., 1997) nur unzureichend beschrieben wurde, iMflt sich die genaue 
alternative S'-Splice Donorsequenz dieser Variante nicht bestimmen. Die Insertion 
von Intron 14 Sequenzen zwischen Exon 14 und Exon 15 in Variante INS3 entsteht 
durch die Benutzung von einer alternativen 3*-Splice Akzeptorsequenz, wodurch der 
3*-Teil von Intron 14 nicht gesplict wird. 

Die in unserer Patentanmeldung PCT/EP/98/03469 beschriebene hTC- Variante INS4 
(Variante 4) zeichnet sich durch den Ersatz von Exon 15 und dem 5 4 -Teilbereich von 
Exon 16 durch die ersten 600 bp des Introns 14 aus. Diese Variante ist auf den 
Gebrauch einer alternativer internen 5* -Splice Donorsequenz in Intron 14 und einer 
alternativen 3 4 -Splice Akzeptorsequenz in Exon 16 zuriickzufuhren, woraus ein 
veranderter C-Terminus resultiert. 

Die in vivo-Generation vvahrscheinlich nicht-funktioneller hTC- Protein varianten, die 
mit der Funktion des vollstandigen hTC-Proteins interferieren konnten, stellt 
zusatlich zur Transkriptionsregulation einen moglichen Mechanismus dar, urn die 
hTC-Proteinfunktion zu kontrollieren. Bis heute ist die Funktion der hTC- 
Splicevarianten nicht bekannt. Obwohl die meisten dieser Varianten vermutlich fur 
Proteine ohne Reverse-Transkriptase-Aktivitat kodieren, konnten sie dennoch eine 
entscheidende Rolle als transdominant-negative Telomerase-Regulatoren spielen, 
indem sie z.B..um die Interaktion mit wichtigen Bindungspartnern kompetieren. 

Die Suche nach mfiglichen Transkriptionsfaktorbindungstellen wurde mit dem „Find 
Pattern"-Aigorithmuses aus dem „GCG Sequenz Analysis" Programmpacket der 
„Genetics Computer Group" (Madison, USA) durchgefiihrt Dadurch vvurden 
verschiedene potentielle Bindungsstellen fur Transkriptionsfaktoren in der 
Nukleotidsequenz von Intron 2 identifiziert, die in der Tab. 2 aufgelistet sind. 
Daruberhinaus wurde im Intron 1 eine Spl-Bindungsstelle (Pos. 43) und im 5'- 
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untranslatiertem Bereich eine c-Myc-Bindungsstelle (cDNA-Position 29-34, vergl. 
Fig. 6) gefunden. 

Beispiel 6 

5 

Urn den oder die Startpunkt(e) der hTC-Transkription in HL 60 Zellen zu ermitteln, 
wurde das 5'-Ende der hTC-mRNA durch Primer-Extension-Analyse bestimmt. 

Es wurden 2 (ag PolyA + -RNA aus HL-60-ZeIlen fur 10 min bei 65°C denaturiert. Zur 

10 Primeranlagerung wurden 1 |il RNasin (30-40 U/ml) und 0,3-1 pmol radioaktiv 
markierter Primer (5 'GTTAAGTTGTAGCTTAC ACTGGTTCTC 3'; 2,5-8xI0 5 
cpm) zugegeben und fur 30 min bei 37°C in einem Gesamtvolumen von 20 
inkubiert. Nach Zugabe von 10 |il SxReverse Transkriptase-Puffer (Fa. Gibco-BRL), 
2 fil 10 mM dNTPs, 2 til RNasin (s.o.), S\x\ 0,1 M DTT (Fa. Gibco-BRL) 2 ^il 

15 ThermoScript RT (15 U/|il; Fa. Gibco-BRL) und 9 (il DEPC-behandeltes Wasser 
erfolgte die P rimer- Verlangerung in einem Gesamtvolumen fiir 1 h bei 58°C. Die 
Reaktion wurde durch 4 \i\ 0,5 M EDTA, pH 8,0, gestoppt und die RNA nach 
Zugabe von 1 \x\ RNaseA (10 mg/ml) fiir 30 min bei 37°C abgebaut. Hierauf wurden 
2,5 |ig gescherte Kalbsthymus-DNA und 100 ^il TE addiert und einmal mit 150^1 

20 Phenol/Cloroform (1:1) extrahiert. Die DNA wurde unter Zusatz von 15 |i! 3 M Na- 
Acetat und 450 \i\ Ethanol fUr 45 min bei -70°C gefallt und anschlieJ3end fur 15 min 
bei 14000 Upm abzentrifugiert. Das Prazipitat wurde einmal mit 70 %igem Ethanol 
gewaschen, luftgetrocknet und in 8 \x\ Sequenzierungs-Stoplosung gelSst. Nach 5 
min Denaturierung bei 80°C wurden die Proben auf ein 6 %iges Polyacrylamidgel 

25 aufgetragen und elektrophoretisch (Ausubel et al., 1987) aufgetrennt (Fig. 5). 

Hierbei wurde eine Haupt-Transkriptionsstartstelle identifiziert, die 1767 bp 5* vom 
ATG-Startcodon der hTC-cDNA Sequenz lokalisiert ist (Nukleotidposition 3346 in 
Fig. 4). Die Nukleotidsequenz um diesen Haupttranskriptionsstart (TTA +1 TTGT) 
30 reprasentiert daruberhinaus ein Initiator-Element (Inr), das in 6 von 7 Nukleotiden 
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mit dem Konsensusmotiv (PyPyA + ,Na/tPyPy) (Smale, 1997) eines Initiator- 
Elementes iibereinstimmt. 

In unmittelbarer NShe des experimentell identifizierten Haupt-Transkriptionsstartes 
5 konnte keine eindeutige TATA-Box identifiziert werden, so daB der hTC-Promoter 
wahrscheinlich in die Familie der TATA-losen Promotoren (Smale, 1997) einzu- 
ordnen ist. Allerdings wurde durch Bioinformatik Analyse eine potentielle TATA- 
Box von Nukleotidposition 1306 bis 1311 (Fig. 4) gefunden. Die zusatziich um den 
Haupt-Transkriptionsstart beobachteten Neben-Transkriptionsstarts wurden auch bei 
10 anderen TATA-losen Promotoren beschrieben (Geng and Johnson, 1993), vvie z.B. in 
den stark regulierten Promotoren einiger Zellzyklusgene (Wick et al. t 1995). 

Beispiel 7 

15 Zusatzlich zu dem in Beispiel 6 beschriebenen, in HL60 Zellen identifizierten 
Startpunkt des hTC Transkriptes, wurde ein weiterer Transkriptionsstartbereich in 
HL60 Zellen identifiziert. Anhand von RT-PCR-Analysen wurde die Region des 
Transkriptionsstarts des hTC -Gens in HL60 Zellen auf die bp -60 bis -105 
eingegrenzt. 

20 

Unter Einsatz von 0,4 jig Poly A-RNA aus HL60 Zellen (Clontech) und dem 
genspezifischen Primer GSP13 (5 l -CCTCCAAAGAGGTGGCTTCTTCGGC-3\ 
cDNA-Position 920-897) wurde hierfur die cDNA mit Hilfe des „First Strand cDN A- 
Synthesis Kit" (Clontech) nach Angaben der Hersteller synthetisiert. In einem 

25 Endvolumen von 50 |il wurden 1 ul cDNA mit 10 pmol dNTP-Mix versetzt und in 
IxPCR-Reaktionspuffer F (PCR-Optimizer Kit der Fa. InVitrogen) und einem Unit 
Platinum-Taq-DNA Polymerase (Fa. Gibco/BRL) eine PCR-Reaktion durchgefuhrt. 
Als Primer wurden jeweils 10 pmol der nachfolgend definierten 5'- und S'-Primer 
zugefugt. Die PCR wurde in 3 Schritten durchgefuhrt. An eine zweiminutige Dena- 

30 turierung bei 94°C schlossen sich 36 PCR-Zyklen an, in denen die DNA zunachst fur 
45 sec bei 94°C denaturiert wurde und anschliefiend fiir 5 min bei 68°C die Primer 
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angelagert und die DNA-Kette verlangert wurde. Zum AbschluB folgte fiir 10 min 
eine Kettenverlangerung bei 68°C. Insgesamt wurden sechs verschiedene 5 l -PCR 
Primer (Primer HTRT5B: S'-CGCAGCCACTACCGCGAGGTGC-S', cDNA- 
Position 105 bis 126; Primer CSS: 5'-CTGCGTCCTGCTGCGCACGTGGGAAGC- 
5 3\ 5'-flankierende Region -49 bis -23; Primer PRO-TEST I: 5'- 
CTCGCGGCGCGAGTTTC AGGC AG-3 1 , 5'-flankierende Region -74 bis -52; 
Primer PRO-TEST2: S'-CCAGCCCCTCCCCTTCCTTTCCO 4 , 5'-flankierende 
Region -1 12 bis -91; Primer PRO-TEST4: 5 l -CCAGCTCCGCCTCCTCCGCGC-3 l , 
5'-flankierende Region -191 - -171; Primer RP-3A: 5 l - 

1 0 CTAGGCCG ATTCG ACCTCTCTCC-3 \ 5 1 -flankierende Region -427 bis -405) mit 
dem 3'-PCR Primer CSRruck (5'-GTCCCAGGGCACGCACACCAG-3\ cDNA- 
Position 245 bis 225) kombiniert. Als Kontrolle wurde zusatzlich zu den Oligo-dT- 
und GSP13-geprimten cDNAs auch genomische DNA filr die PCR eingesetzt. Wie in 
Fig. 9 gezeigt, wurde nur mit den Primerkombinationen HTRT5B-C5Rriick, C5S- 

1 5 C5Rriick und PRO-TEST 1 -CSRruck ein PCR-Produkt erhalten, was darauf hinweist, 
dafi der Startpunkt der hTC-Transkription in der Region zwischen bp-60 und bp- 105 
liegt. 

Beispiel 8 

20 

In der ca. 11,2 kb isolierten 5 l -flankierenden Region des hTC-Gens befinden sich 
mehrere extrem GC-reiche Bereiche, sog. CpG Islands. Ein CpG Islands mit einem 
GC-Gehalt von > 70 % reicht von bp - 1214 bis in Intron 2. Zwei weitere GC-reiche 
Bereiche mit einem GC-Gehalt von > 60 °/o reichen von bp —3872 bis bp —3 113 bzw. 
25 bp -5363 bis bp -3941. Die Lage der CpG Islands ist in der Fig. 11 graphisch 
dargestellt. 

Die Suche nach mOglichen Transkxiptionsfaktorbindungstellen wurde mit dem „Find 
Pattern"-Algorithmuses aus dem „GCG Sequenz Analysis" Programmpacket der 
30 ^Genetics Computer Group" (Madison, USA) durchgefiihrt. Dadurch wurden 
verschiedene potentielle Bindungsstellen in der Region bis -900 bp upstream vom 
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Transiations-Startcodon ATG indentifiziert: fiinf Spl-Bindungsstellen, eine c-Myc- 
Bindungsstelle, eine CCAC-Box (Fig. 10). ZusStzlich wurden eine CCAAT-Box und 
eine zweite c-Myc-Bindungsstelle an den Positionen -1788 bzw. -3995 der 5'- 
flankierenden Region gefunden. 

5 

Beispiel 9 

Um die AktivitSt des hTC-Promotors zu anaiysieren, wurden durch PCR-Ampli- 
fikation vier verschieden lange hTC-Promotorsequenzabschnitte generiert und 5' vor 

10 das Reportergen Luziferase in den Vektor pGL2 der Fa. Promega kloniert. Ais DNA- 
Quelle fur die PCR-Amplifikation vvurde das aus dem Phagenklon P12 subklonierte, 
8,5 kb grofie Sacl-Fragment gevviihlt. In einem Endvolumen von 50 f.il vvurden 35 ng 
dieser DNA mit 10 pmol dNTP-Mix versetzt und in IxPCR-Reaktionspuffer (PCR- 
Optimizer Kit der Fa. InVitrogen) und einem Unit Platinum-Taq-DNA Polymerase 

15 (Fa. Gibco/BRL) eine PCR-Reaktion durchgefuhrt. Als Primer vvurden jeweils 
20 pmol der nachfolgend defmierten 5 4 - und 3'-Primer zugefugt. Die PCR vvurde in 3 
Schritten durchgefuhrt. An eine zweiminiitige Denaturierung bei 94°C schlossen sich 
30 PCR-Zykien an, in denen die DNA zunachst fur 45 sec bei 94°C denaturiert 
vvurde und anschlieflend fiir 5 min bei 68°C die Primer angelagert und die DNA- 

20 Kette verlangert vvurde. Zum AbschluB folgte fur 10 min eine Kettenverlangerung 
bei 68°C. Als 3 t -PCR-Primer vvurde jeweils der Primer PK-3A (5 ( - 
GCAAGCTTGACGCAGCGCTGCCTGAAACTCG-3', Position -A3 bis -65) ge- 
wahlt, der einen Sequenzbereich 42 bp upstream vom START-Codon ATG erkennt. 
Durch Kombination des PK-3A-Primers mit dem 5*-PCR-Primer PK-5B (5'- 

25 CCAGATCTCTGGAACACAGAGTGGCAGTTTCCO 4 , Position ^093 bis -4070) 
vvurde ein 4051 bp groBes Pro motor-Fragment amplifiziert (NPK8). Die 
Kombination des Primerpaares PK-3A und PK-5C (5 4 - 
CC AG ATCTGC ATGAAGTGTGTGGGG ATTTGC AG-3 1 , Position -3 1 20 bis- 
3096) ftihrte zur Amplifikation eines 3078 bp groBen Promotorfragmentes (NPK15). 

30 Ein 2068 bp groBes Promotorfragment vvurde durch die Verwendung der Primer- 
kombination PK-3A und PK-5D (5 l - 
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GG AG ATCTG ATCTTGGCTTACTGC AGCCTCTG-3 * , Position -2110 bis -2087) 
ampiifziert (NPK22). Der Einsatz der Primerkombination PK-3A und PK-5E (5'- 
GG AG ATCTGTCTGG ATTCCTGGG A AGTCCTC A-3 1 , Position -1125 bis -1102) 
fiihrte schliefilich zur Amplifikation eines 1083 bp grofien Promotorfragmentes 
5 (NPK27). Der PK-3A Primer enthalt eine HindlH. Erkennungssequenz. Die 
verschiedenen 5* -Primer enthalten eine Bglll-Erkennungssequenz. 

Die entstandenen PCR-Produkte wurden mit Hilfe des QIA quick spin PGR 
Purification Kits der Fa. Qiagen nach Angaben der Hersteller aufgereinigt und 

10 anschlieBend mit den Restriktionsenzymen Bglll und HindlH verdaut. Mit den 
gleichen Restriktionsenzymen wurde der pGL2-Promotor-Vektor verdaut und der in 
diesem Vektor enthaltene SV40-Promotor freigesetzt und abgetrennt. Die PCR- 
Promotorfragmente wurden in den Vektor ligiert, in kompetente DH5a-Bakterien der 
Fa. Gibco/BRL transformiert. Aus transformierten Bakterienklonen vvurde DNA fur 

15 die nachfolgend beschriebenen Promotor-Aktivitats-Analysen mit Hilfe des Qiagen 
Plasmid-Kits der Fa. Qiagen isoliert. 

Bcispiet 10 

20 Die Aktivitat des hTC-Promotors wurde in transienten Transfektionen in 
eukaryotischen Zellen analysiert. 

Alle Arbeiten mit eukaryotischen Zellen erfolgten an einem sterilen Arbeitsplatz. 
CHO-K1 und HEK 293 Zellen wurden yon der American Type Culture collection 
25 bezogen. 

CHO-K1 Zellen wurden in DMEM Nut Mix F-12 Zellkulturmedium (Fa. Gibco- 
BRL, Bestellnummer: 21331-020) mit 0,15% Streptomycin/Penezillin, 2 mM 
Glutamin und 10 % FCS (Fa. Gibco-BRL) gehalten. 

30 
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HEK 293 Zellen wurden in DMOD Zellkulturmedium (Fa. Gibco-BRL, Bestell- 
nummer: 41965-039) mit 0,15 % Streptomycin/Penizillin, 2 mM Glutamin und 10 % 
FCS (Fa. Gibco-BRL) kultiviert. 

5 CHO-K1 und HEK 293 Zellen wurden in wasssergesattigter Atmosphare bei 37°C 
unter Begasung mit 5% CO, kultiviert. Bei konfluentem Zellrasen wurde das 
Medium abgesaugt, die Zellen mit PBS (100 mM KH 2 P0 4 pH 7,2; 150 mM NaC!) 
gewaschen und durch Zugabe einer Trypsin-EDTA LSsung (Fa. Gibco-BRL) 
abgelOst. Das Trypsin wurde durch Mediumzugabe inaktiviert und die Zellzahl mit 

10 einer Neubauer-Zahlkammer ermittelt, um die Zellen in gewunschter Dichte auszu- 
plattieren. 

FQr die Transfektion wurden pro Well jeweils 2x 10 5 -HEK 293 Zellen in einer 24- 
well Zellkulturplatte ausplattiert. Nach 3 Stunden wurde das HEK 293 Medium 

15 entfernt. Fur die Transfektion wurden bis zu 2,5 ug Plasmid-DNA, I ug eines CMV 
15-Gal Plasmidkonstruktes (Fa. Stratagene, Bestellnummer: 200388), 200 ul serum- 
freies Medium und 10 ul Transfektionsreagenz (DOTAP der Fa. Boehringer 
Mannheim) fur 15 Minuten bei Raumtemperatur inkubiert und anschliefiend auf die 
HEK 293 Zellen gleichmaflig aufgetropft. Nach 3 Stunden wurden 1,5 ml Medium 

20 hinzugegeben. Nach 20 Stunden wurde das Medium gewechselt. Nach weiteren 24 
Stunden wurden die Zellen zur Bestimmung der Luziferase- und der B-Gal-Aktivitat 
geerntet. Dazu wurden die Zellen im Zellkultur-Lysisreagenz (25 mM Tris [pH 7,8] 
mit H 3 P0 4 ; 2 mM CDTA; 2 mM DTT; 10% Glycerol; 1% Triton X-100) fur 15 
Minuten bei Raumtemperatur lysiert. Zwanzig ul dieses Zellysats wurden mit 100 ul 

25 Luziferase-Assaypuffer (20 mM Tricin; 1,07 mM (MgC0 3 ) 4 Mg(OH) 2 *5H 2 0; 
2,67 mM MgS0 4 ; 0,1 mM EDTA; 33,3 mM DTT; 270 uM Coenzym A; 470 uM 
Luciferin, 530 uM ATP) gemischt und das durch die Luziferase generierte Licht 
gemessen. 

30 Zur Messung der B-Galaktosidaseaktivitat wurden gleiche Mengen Zellysat und B- 
Galaktosidase-Assaypuffer (100 mM Natriumphosphatpuffer pH 7,3; 1 mM MgCU; 
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50 mM B-Merkaptoethanol; 0,665 mg/ml ONPG) flir mindestens 30 Minuten bei 
37°C oder bis eine ieichte Gelbfarbung auftrat, inkubiert. Die Reaktion wurde durch 
Zugabe von 100 |il 1 M Na 2 C0 3 gestoppt und die Absorption bei 420 nm bestimmt. 

5 Fur die Analyse des hTC-Promotors wurden vier verschieden lange hTC-Promotor- 
sequenzabschnitte 5' vor das Reportergen Luziferase kloniert (vergl. Beispiel 9). 

In der Fig. 11 sind die relativen Luziferase Aktivitaten zvveier unabhangiger 
Transfektionen mit den Konstmkten NPK8, NPK15, NPK22 und NPK27 in HEK 

10 293 Zellen aufgetragen. Jedes Experiment vvurde in Duplikaten durchgefuhrt. 
Daruberhinaus wurde die Standardabweichung angegeben. Das Konstukt NPK 27 
zeigt eine 40fach hohere Luziferaseaktivitat als die Basalaktivitat des promotorlosen 
Luziferase-Kontrollkonstrutes (pGL2-basic) und eine 2 bis 3fach hohere Aktivimt als 
das SV40 Promotorkontroll-Konstrukt (pGL2PRO). Interessanterweise wurde im 

15 Vergleich zu dem Konstrukt NPK27 eine 2 bis 3fach geringere Luziferaseaktivitat in 
mit langeren hTC Promotorkonstukten (NPK8, NPK15, NPK22) transfizierten Zellen 
beobachtet. Ahnliche Ergebnisse wurden auch in CHO Zellen beobachtet (Daten 
nicht gezeigt). 
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Patentanspriiche 

1. Regulatorische DNA-Sequenzen flir das Gen der humanen katalytischen 
Telomerase-Untereinheit. 

2. DNA-Sequenzen gemaB Anspruch 1, dadurch gekennzeichnet, daB es sich urn 
Intronsequenzen gemaB SEQ IDN04, 5,6, 7, 8,9, 10, 11, 12, 13, 14, 15, 16, 
17, 18, 19 und/oder 20 oder urn regulatorisch wirksame Fragmente dieser 
Sequenzen handelt. 

3. DNA-Sequenzen gemaB Anspruch 1, dadurch gekennzeichnet, daB es sich um 
die 5*-flankierende regulatorische DNA-Sequenz fiir das Gen der humanen 
katalytischen Telomerase-Untereinheit gemaB Fig. 10 (SEQ ID NO 3) oder 
um regulatorisch wirksame Fragmente dieser DNA-Sequenz handelt. 

4. Rekombinantes Konstrukt, enthaltend eine DNA-Sequenz gemaB einem der 
Anspriiche 1 bis 3. 

5. Rekombinantes Konstrukt gemaB Anspruch 4, dadurch gekennzeichnet, daB 
es weiterhin eine oder mehrere DNA-Sequenzen enthalt, die fur Polypeptide 
oder Proteine kodieren. 

6. Vektor, enthaltend ein rekombinantes Konstrukt gemaB Anspruch 4 oder 5. 

7. Verwendung von rekombinanten Konstrukten bzw. Vektoren gemaB einem 
der Anspriiche 4 bis 6 zur Herstellung von Arzneimitteln. 

8. Rekombtnante Wirtszellen, enthaltend rekombinante Konstrukte bzw. Vek- 
toren gemaB einem der Anspriiche 4 bis 6. 
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9. Verfahren zur Identifizierurig von Substanzen, die die Promoter-, Silencer- 
oder Enhanceraktivitat der humanen katalytischen Telomerase-Untereinheit 
beeinflussen, das folgende Schritte umfafit: 

A. Zugabe etner Kandidatensubstanz zu einer Wirtszelle, enthaltend 
DNA-Sequenzen gemafl einem der Anspriiche 1 bis 3, funktionell 
verknupft mit einem Reportergen, 

B. Messung des Substanzeffektes auf die Reportergenexpression. 

10. Verfahren zur Identifizierung von Faktoren, die spezifisch an die DNA gemafl 
einem der Anspriiche 1 bis 3 oder an Fragmente davon binden, dadurch 
gekennzeichnet, daC man eine Expressions-cDNA-Bibliothek mit einer DNA- 
Sequenz gemafl einem der Anspriiche 1 bis 3 oder Teilfragmenten unter- 
schiedlichster LSnge als Sonde screent. 

1 1 . Transgene Tiere, enthaltend rekombinante Konstrukte bzw. Vektoren gemafl 
Anspriichen 4 bis 6. 

12. Verfahren zur Detektion Telomerase-assoziierter Zustande bei einem 
Patienten, das folgende Schritte umfafit: 

A. Inkubation eines rekombinanten Konstruktes bzw. Vektors gemafl 
Anspriichen 4 bis 6 das bzw. der zusStzlich ein Reportergen enthalt 
mit KSrperfliissigkeiten oder zellularen Proben, 

B. Detektion der Reportergenaktivitat, urn einen diagnostischen Wert zu 
erhalten, 
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Vergleich des diagnostischen Wertes mit Standardwerten fur das 
Reportergenkonstrukt in standardisierten normalen Zellen oder 
KQrperflussigkeiten des gleichen Typs wie die Testprobe. 
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Fig. 2 
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Fig. 3 
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Fig. 4 

GAGCTCTGAA CCGTGGAAAC GAACATGACC CTTGCCTGCC TGCTTCCCTG GGTGGGTCAA GGGTAATGAA 70 
GTGGTGTGCA GGAAATGGCC ATGTAAATTA CACGACTCTG CTGATGGGGA CCGTTCCTTC CATCATTATT 140 
CATCTTCACC CCCAACGACT GAATGATTCC AGCAACTTCT TCGGGTGTGA CAAGCCATGA CAAAACTCAG 210 
TACAAACACC ACTCTTTTAC TAGGCCCACA GAGCACGGGC CACACCCCTG ATAXATXAAG AGTCCAGGAG 280 
AGATGAGGCT GCTTTCAGCC ACCAGGCTGG GGTGACAACA GCGCCTGAAC AGTCTGTTCC TCTAGACTAG 350 
TAGACCCTGG CAGGCACTCC CCCAAATTCT AGGGCCTGGT TGCTGCTTCC CGACGCCCCC ATCTGCCCTG 420 
GAGACTCAGC CTGGGGTGCC ACACTGAGGC CAGCCCTGTC TCCACACCCT CCGCCTCCAG GCCTCAGCTT 490 
CTCCAGCAGC TTCCTAAACC CTGGGTGGGC CGTGTTCCAG CGCTACTGTC TCACCTGTCC CACTGTGTCT 560 
TGTCTCAGCG ACGTAGCTCG CACGGTTCCT CCTCACATGG GGTGTCTGTC TCCTTCCCCA ACACTCACAT 630 
GCGTTGAAGG GAGGAGATTC TGCGCCTCCC AGACTGGCTC CTCTGAGCCT GAACCTGGCT CGTGGCCCCC 700 
GATGCAGGTT CCTGGCGTCC GGCTGCACGC TGACCTCCAT TTCCAGGCGC TCCCCGTCTC CTGTCATCTG 770 
CCGGGGCCTG CCGGTGTGTT CTTCTGTTTC TGTGCTCCTT TCCACGTCCA GCTGCGTGTG TCTCTGCCCG 840 
CTAGGGTCTC GGGGTTTTTA TAGGCATAGG ACGGGGGCGT GGTGGGCCAG GGCGCTCTTG GGAAATGCAA 910 
CATTTGGGTG TGAAAGTAGG AGTGCCTGTC CTCACCTAGG TCCACGGGCA CAGGCCTGGG GATGGAGCCC 980 
CCGCCAGGGA CCCGCCCTTC TCTGCCCAGC ACTTTCCTGC CCCCCTCCCT CTGGAACACA GAGTGGCAGT 10SO 
TTCCACAAGC ACTAAGCATC CTCTTCCCAA AAGACCCAGC ATTGGCACCC CTGGACATTT GC CCCACA CC 1120 
CCTGGGAATT CACGTGACTA CGCACATCAT GTACACACTC CCCTCCACGA CCGACCCCCG CTGTTTTATT 1190 
TTAATACCTA CAAAGCAGGG AAATCCCTGC TAAAATGTCC TTTAACAAAC TGGTTAAACA AACGGGTCCA 1260 
TCCGCACGGT GGACAGTTCC TCACAGTGAA GAGGAACATG CCGTTTATAA AGCCTGCAGG CATCTCAAGG 1330 
GAATTACGCT GAGTCAAAAC TGCCACCTCC ATGGGATACG TACGCAACAT GCTCAAAAAG AAAGAATTTC 1400 
ACCCCATGGC AGGGGAGTGG TTAGGGGGGT TAAGGACGGT GGGGGCGGCA GCTGGGGGCT ACTGCACGCA 1470 
CCTTTTACTA AAGCCAGTTT CCTGGTTCTG ATGGTATTCG CTCAGTTATG GGAGACTAAC CATAGGGGAG 1540 
TGGGGATGGG GGAACCCGGA GGCTGTGCCA TCTTTGCCAT GCCCGAGTGT CCTGGGCAGG ATAAT CCTCT 1610 
AGAGATGCCC ACGTCCTGAT TCCCCCAAAC CTGTGGACAG AACCCGCCCG GCCCCAGGGC CTTTGCAGGT 1680 
GTGATCTCCG TGAGGACCCT GAGGTCTGGG ATCCTTCGGG ACTACCTGCA GGCCCGAAAA GTAATCCAGG 1750 
GGTTCTGGGA AGAGGCGGGC AGGAGGGTCA GAGGGGGGCA GCCTCAGGAC GATGGAGCCA GTCAGTCTGA 1820 
GGCTGAAAAG GGAGGGAGGG CCTCGAGCCC AGGCCTGCAA GCGCCTCCAG AAGCTGGAAA AAGCGGGGAA 1890 
GGGACCCTCC ACGGAGCCTG CAGCAGGAAG GCACGGCTGG CCCTTAGCCC ACCAGGGCCC ATCGTGGACC 1960 
TCCGGCCTCC GTCCCATAGG AGGGCACTCG CGCTGCCCTT CTAGCATGAA GTGTGTGGGG ATTTGCAGAA 2030 
GCAACAGGAA ACCCATGCAC TGTGAATCTA GGATTATTTC AAAACAAAGG TTTACAGAAA CAI CCAAG GA 2100 
CAGGGCTGAA GTGCCTCCGG GCAAGGGCAG GGCAGGCACG AGTGATTTTA TTTAGCTATT TTATTTTATT 2170 
TACTTACTTT CTGAGACAGA GTTATGCTCT TGTTGCCCAG GCTGGAGTGC AGCGGCATGA TCTTGGCTCA 2240 
CTGCAACCTC CGTCTCCTGG GTTCAAGCAA TTCTCGTGCC TCAGCCTCCC AAGTAGCTGG GATTTCAGGC 2310 
GTGCACCACC ACACCCGGCT AATTTTGTAT TTTTAGTAGA GATGGGCTTT CACCATGTTG GTCAAGCTGA 2380 
TCTCAAAATC CTGACCTCAG GTGATCCGCC CACCTCAGCC TCCCAAAGTG CTGGGATTAC AGGCATGAGC 2450 
CACTGCACCT GGCCTATTTA ACCATTTTAA AACTTCCCTG GGCTCAAGTC ACACCCACTG GXAAGGAGTT 2520 
CATGGAGTTC AATTTCCCCT TTACTCAGGA GTTACCCTCC TTTGATATTT TCTGTAATTC TTCGTAGACT 2590 
GGGGATACAC CGTCTCTTGA CATATTCACA GTTTCTGTGA CCACCTGTTA TCCCAXGGGA CCCACTGCAG 2660 
GGGCAGCTGG GAGGCTGCAG GCTTCAGGTC CCAGTGGGGT TGCCATCTGC CAGTAGAAAC CTGATGTAGA 2730 
ATCAGGGCGC AAGTGTCGAC ACTGTCCIGA ATCXCAATGT CTCAGTGTGT GCTGAAACAT GXAGAAATTA 2800 
AAGTCCATCC CTCCTACTCT ACTGGGATTG AGCCCCTTCC CTATCCCCCC CCAGGGGCAG AGGAGTTCCT 2870 
CTCACTCCTG TGGAGGAAGG AAXGATACTT TGTTATTTTT CACTGCTGGT ACTCAAICCA CTGTTTCATT 2940 
TGTTGGTTTG TTTGTTTTGT TTTGAGAGGC GGTTTCACTC TTGTTGCTCA GGC TGCAC GC AGTGCAATGG 3010 
CGCGATCTTG GCTTACTGCA GCCTCTGCCT CCCAGGTTCA AGTGATTCTC CTGCTTCCGC CTCCCATTTG 3080 
GCTGGGATTA CACGCACCCG CCACCAXGCC CAGCTAATTT TTTGTATTTT TAGTAGAGAC GGGGGTGGGT 3150 
GGGGTTCACC ATGTTGGCCA GGCIGGTCTC GAACTTCTGA CCTCAGATGA TCCACCTGCC TCTGCCTCCT 3220 
AAAGTGCTGG GATTACACGT GTGAGCCACC ATGCCCAGCT CAGAATTTAC TCTCTTTAGA AACAT CTGGG 3290 
TCTGAGGTAG GAACCTCACC CCACTCAAGT GTTGTGGTGT TTTAAGCCAA T GA3CAG AATT TTTTXATTGT 3360 
TCMAGAACA CTCTTGATGT TTTACACTGT GATGACTAAG ACATCATCAG CTTOTCAAAG A CACACTAA C 3430 
TGCACCCAXA ATACTGGGGT GTCTTCTGGG TATCAGCAAT CTTCATTGAA TGCCGGGACC CCTTTCCTCG 3500 
CCATGCACAT GGTGTTAATT ACXCCAGCAT AAT C TT C TGC TTCCATTTCT TLT CTOCCC T CTTTTAAAAT 3570 
TGTGTTTTCT ATGTTGGCTT CICTGCAGAG AACCAGTGTA AGCTACAACT TAACTTTTGT TGGAACAAAT 3640 
TTTCCAAACC GCCCCTTTGC CCTAGTGGCA GAGACAATTC ACAAACACAC CCCTTTAAAA AGGCTTAGGG 3710 
ATCACXAAGG GGATT TC TAC AAGAGCGACC TGTAATCCTA AGTATTTACA AGACGAGGCT AACCTCCAGC 3780 
GAGCGZGACA GCCCAGGGAG GGTGCGAGGC CTGTTCAAAT GCTAGCTCCA TAAATAAAGC AATTTCCTCC 3850 
GGCAGTTTCT GAAAGTAGGA AAGGTTACAT TTAAGGTTGC GTTTGTXAGC ATTTCAGXGT TTG CCGA CCT 3920 
CAGCTACAGC ATCCCTGCAA GGCCTCGGGA GACCCAGAAG TTTCTCGCCC CCTTAGAICC AAACTTGAGC 3990 
AACCCGGAGT CTGGATTCCT GGGAAGTCCT CAGCTGTCCT GCGGTTGTGC CGGGCCCCCA GGTCTGGAGG 4060 
GGACCAGXGG CCGTGTGGCT TCTACTGCTG GGCTGGAAGT CGGGCCTCCT AGCTCTGCAG TCCGAGGCTT 4130 
GGAGCCAGGT GCCTGGACCC CGACGCTGCC CTCCACCCTG TGCGGGCGGG ATGTGACCAG ATGTTGGCCT 4200 
CATCTGCCAG ACAGACTGCC GGGGCCCAGG GTCAAGGCCG TTGTGGCTGG TGTGAGGCGC CCGGTGCGCG 4270 
GCCAGCAGGA GCGCCTGCCT CCATTTCCCA CCCTTTCTCG ACGGGACCGC CCCGGTCGGT GATTAACAGA 4340 
TTTGGGGTGG TTTGCTCAXG GTGGGGACCC CTCGCCGCCT GAGAACCTGC AAAGAGAAAT GACGGGCCTG 4410 
TGTCAAGGAG CCCAAGTCGC GGGGAAGTGT TGCAGGGAGG CACTCCGGGA GGTCCCGCGT GCCCGTCCAG 4480 
GGAGCAATGC GTCCTCGGGT TCGTCCCCAG CCCCGTCTAC GCGCCTCCGT CCTCCCCTTC ACGTCCGGCA 4550 
TTCGTGGTGC CCGGAGCCCG ACGCCCCCCG TCCGGACCTG GAGGCAGCCC TGGGTCTCCG GAXCAGGCCA 4620 
GCGGCCAAAG GGTCCCCGCA CGCACCTGTT CCCAGGGCCT CCACATCATG GCCCCTCCCT CGGGTTACCC 4690 
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Fig. 4 (Fortsetzung) 

CACAGCCTAC GCCGAXTCGA CCTCTCTCCG CTGGGGCCCT CGCTGGCGTC CCTCCACCCT GGGAGCGCGA 4760 
GCGGCGCGCG GGCGGGGAAG CGCGGCCCAG ACCCCCGGGT CCGCCCGGAG CAGCTGCGCT GTCGGGGCCA 4830 
GGCCGGGCTC CCACTGGATT CGCGGGCACA GACGCCCAGG ACCGCGCTCC CCACCTGGCG GAGGGACTGG 4900 
GGACCCGGGC ACCCGTCCTG CCCCTTCACC TTCCAGCTCC GCCTCCTCCG CGCGGACCCC GCCCCGTCCC 4970 
GACCCCTCCC GGGTCCCCGG CCCAGCCCCC TCCGGGCCCT CCCAGCCCCT CCCCTTCCTT TCCGCGGCCC 5040 
CGCCCTCTCC TCGCGGCCCG AGTTTCAGGC AGCGCTGCGT CCTGCTGCGC ACGTGGGAAG CCCTGGCCCC S110 
GGCCACCCCC GCGATG 5126 
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Fig. 5 
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Fig. 6 

GTTTCAGGCA GCGCTGCGTC CTGCTGCGCA CGTGGGAAGC CCTCCCCCCC GCCACCCCCG CGATGCCGCG 70 
CGCTCCCCGC TGCCGAGCCG TGCGCTCCCT GCTGCGCAGC CACTACCGCG AGGTGCTGCC GCTGGCCACG 140 
TTCGTGCGGC GCCTGGGGCC CCAGGGCTGG CGGCXGGTGC AGCGCGGGGA CCCGGCGGCT TTCCGCGCGC 210 
TGGTGGCCCA GTGCCTGGTG TGCGTGCCCT GGGACGCACG GCCGCCCCCC GCCGCCCCCT CCTTCCGCCA 280 
GGTGTCCTGC CTGAAGGAGC TGGTGGCCCG AGTGCTGCAG AGGCTGTGCG AGCGCGGCGC GAAGAACGTG 350 
CTGCCCTTCG GCTTCGCGCT GCTGGACGGG GCCCGCGGGG GCCCCCCCGA GGCCTTCACC ACCAGCGTGC 420 
GCAGCTACCT GCCCAACACG GTGACCGACG CACTGCGGGG GAGCGGGGCG TGGGGGCTGC TGCTGCGCCG 490 
CGTGGGCGAC GACGTGCTGG TTCACCTGCT GGGACGCTGC GCGCTCTTTG TGCTGGTGGC TCCCAGCTGC 560 
GCCTACCAGG TGTGCGGGCC GCCGCTGTAC CAGCTCGGCG CTGCCACTCA GGCCCGGCCC CCGCCACACG €30 
CTAGTGGACC CCGAAGGCGT CTGGGATGCG AACGGGCCTG GAACCAXAGC GTCAGGGAGG CCGGGGTCCC 700 
CCTGGGCCTG CCAGCCCCGG GTGCGAGGAG GCGCGGGGGC AGTGCCAGCC GAAGTCTGCC GTTGCCCAAG 770 
AGGCCCAGGC GTGCCGCTGC CCCTGAGCCG GAGCGGACGC CCGTTGGGCA GGGGTCCTGG GCCCACCCGG 840 
GCAGGACGCG TGGACCGAGT GACCGTGGTT TCTGTGTGGT GTCACCTGCC AGACCCGCCG AAGAAGCCAC 910 
CTCTTTGGAG GGTCCGCTCT CTGGCACGCG CCACTCCCAC CCATCCGTGG GCCGCCAGCA CCACGCGGGC 980 
CCCCCATCCA CATCGCGGCC ACCACGTCCC TGGGACACGC CTTCTCCCCC GGTGTACGCC GAGACCAAGC 1050 
ACTTCCTCTA CTCCTCAGGC GACAAGGAGC AGCTGCGGCC CTCCTTCCTA CTCAGCTCTC TGAGGCCCAG 1120 
CCTGACTGGC CCTCGGAGGC TCGTGGAGAC CATCTTTCTG GGTTCCAGGC CCTGGATGCC AGGGACTCCC 1190 
CGCAGGTTGC CCCGCCTGCC CCAGCGCTAC TGGCAAATGC GGCCCCTGTT TCTGGAGCTG CTTGGGAACC 1260 
ACGCGCAGTG CCCCTACGGG GTGCTCCTCA AGACGGACTG CCCGCTGCGA GCTGCGGTCA CCCCAGCAGC 1330 
CGGTGTCTGT GCCCGGGAGA AGCCCCAGGG CTCTGTGGCG GCCCCCGAGG AGGAGGACAC AGACCCCCGT 1400 
CGCCTGGTGC AGCTGCTCCG CCAGCACAGC AGCCCCTGGC AGGTGTACGG CTTCGTGCGG GCCTGCCTGC 1470 
GCCGGCTGGT GCCCCCAGGC CTCTGGGGCT CCAGGCACAA CGAACGCCGC TTCCTCAGGA ACACCAAGAA 1540 
GTTCATCTCC CTGGGGAAGC ATGCCAAGCT CTCGCTGCAG GAGCTGACGT GGAAC ATGAS CGTGCGGGAC 1610 
TGCGCTTGGC TGCGCAGGAG CCCAGGGCTT GGCTGTGTTC CGGCCGCAfiA GCACC GTCTG CGTGAGGAGA 1680 
TCCTGGCCAA GTTCCTGCAC TGGCTGATGA GTGTGTACGT CGTCGAfiCTG CTCAGGTCTT TCTTTTAIGT 1750 
CACGGAGACC ACGTTTCAAA AGAACAGGCT CTTTTTCTAC CGGAAGAGTG TCTGGAGCAA GTTGCAAAGC 1820 
ATTGGAATCA GACAGCACTT GAAGAGGGTG CAGCTGCGGG AGCTGTCGGA AGCAGAGGTC AGGGAGCATC 1890 
GGGAAGCCAG GCCCGCCCTG CTGACGTCCA GACTCCGCTT CATCCCCAAG CCTGACGGGC TGCGGCCGAX 1960 
TGTGAACATG GACTACCTCG TGGGAGCCAG AACGTTCCGC AGAGAAAAGA GGGCCGAGCG TCTCA CCTC G 2030 
AGGGTGAAGG CACTGTTCAG CGTGCTCAAC TACGAGCGGG CGCCCCGCCC CGGCCTCCTG GGCGCCTCTG 2100 
TGCTGGGCCT GGACGAXAXC CACAGGGCCT GGCGCACCTT CGTGCTGCGT GTGCGGGCCC AGGACCCGCC 2170 
GCCTGAGCTG TACTTTGTCA AGGTGGATGT GACGGGCGCG TACGACACCA TCCCCCAGGA CAGGCXCACG 2240 
GAGGTCATCG CCAGCATCAT CAAACCCCAG AACACGTACT GCGTGCGTCG GTATGCCGTG GTCCAGAAGG 2310 
CCGCCCATGG GCACGTCCGC AAGGCCTTCA AGAGCCACGX CTCTACCTTG ACAGACCTCC ACCCGTACAT 2380 
GCGACAGTTC GTGGCTCACC TGCAGGAGAC CAGCCCGCTG AGGGATGCCG TCGTCATCGA CCAGACCTCC 2450 
TCCCTGAATG AGGCCAGCAG TGGCCTCTTC GACGTCTTCC TACGCTTCAX GTGCCACCAC GCCGXGCGCA 2520 
TCAGGCGCAA GTCCTACGTC CACTGCCAGG GGATCCCGCA GGGCTCCATC CTCTCCACGC TGCT CTGCA G 2590 
CCTGTGCXAC GGCGACATGG ASAACAAGCT GTTTGCGGGG ATTCGGCGGG ACGGGCTGCT CCTGCGTTTG 2660 
GTGGATGATT T C TT G TTGGT GACACCTCAC CTCACCCACG CGAAAACCTT CCTCAGGACC CTGGTCCGAG 2730 
GTGTCCCTGA GTATGGCTGC GTGGTGAACT TGCGGAAGAC AGTGGTGAAC TTCCCTGTAC AAGACGAGGC 2800 
CCTGGGTGGC ACGGCTTTTG TTCAGATGCC GGCCCACGGC CTATTCCCCT GGTGCGGCCT G CTGCT GGAT 2870 
ACCCGGACCC TGGAGCTGCA GAGCGACTAC TCCAGCTATG CCCGGACCTC CATCAGACCC AGTCTCACCT 2940 
TCAACCGCGG CTTCAAGGCT GGGAGGAACA TGCGTCGCAA ACTCTTTGGG GTCTTGCGGC TGAACTGTCA 3010 
CAGCCTGTTT CTGGATTTGC AGGTGAACAG CCTCCAGACG GTGTGCACCA ACATCTCACAA GATCCTCCTG 3080 
CTGCAGGCGT ACACGTTTCA CGCATGTGTG CTGCAGCTCC CATTTCATCA GCAAGTTTGG AAGAACCCCA 3150 
CATTTTTCCT GCGCGTCAXC TCTGACACGG CCTCCCTCTG CTACTCCATC CTGAAAGCCA AGAACGCAGG 3220 
GATGTCGCTG GGGGCCAAGG GCGCCGCCGG CCCXCTGCCC TCCGAGGCCG TGCAGTGGCT GTGCCACCAA 3290 
GCATTCCTGC TCAAGCTGAC TCGACACCGT GTCACCTACG TGCCACTCCT GGGGTCACTC AGGACAGCCC 3360 
AGACGCACCT GACTCGGAAG CTCCCGGCGA CGACCCTGAC TCCCCTGGAG G CCGCAGCCA ACCCGGCACT 3430 
GCCCTCAGAC TTCAAGACCA TCCTGGACTG ATGGCCACCC GCCCACAGCC AGGCCGAGAG CAGACACCAG 3500 
CAGCCCTGTC ACGCCGGGCT CTACGTCCCA GGGAGGGAGG GGCGGCCCAC ACCCAGGCCC GCACCGCTGG 3570 
GAGTCTGAGG CCTGAGTGAC TGTTTGGCCG AGGCCTGCAT GTCCGGCTGA AGGC TGAGTG TCCGGCTGAG 3640 
GCCTGAGCGA GTGTCCAGCC AAGGGCTGAG TGTCCAGCAC ACCTGCCGTC TTCACTTCCC CACAGGCTGG 3710 
CGCTCGGCTC CACCCCAGGG CCAGCTTTTC CTCACCAGGA GCCCGCCTTC CACTCCCCAC ATAGGAATAG 3780 
TCCATCCCCA GATTCGCCAT TCTTCACCCC TCGCCCTGCC CTCCTTTGCC TTCCACCCCC ACCATCCAGG 3850 
TGGAGACCCT GAGAAGGACC CTGGGAGCTC TGGGAATTTG GAGTGACCAA AGGTGTGCCC TGXACACAGG 3920 
CGAGGACCCT GCACCTGGAT GGGGGTCCCT GTGGGTCAAA TTGGGGGGAG GTGCTGTGGG AGTAAAATAC 3990 
TGAATATATG AGTTTTTCAG TTTTGAAAAA AAAAAAAAAA AAAAAAA A AA AA 4042 
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Fig. 10 

ACTTGAGCCC AAGAGTTCAA GGCTACGGTG AGCCATGATT GCAACACCAC ACGCCAGCCT TGGTGACAGA -11204 
ATGAGACCCT GTCTCAAAAA AAAAAAAAAA AATTGAAATA ATATAAAGCA TCTTCTCTGG CCACAGTGGA -11134 
ACAAAACCAG AAATCAACAA CAAGAGGAAT TTTGAAAACT ATACAAACAC ATGAAAATTA AACAATATAC -11064 
TTCTGAATGA CCAGTGAGTC AATGAAGAAA 'TTAAAAAGGA AATTGAAAAA TTTATTTAAG CAAATGATAA -10994 
CGGAAACATA ACCTCTCAAA ACCCACGGTA TACAGCAAAA GCAGTGCTAA GAAGGAAGTT TATAGCTATA -10924 
AGCAGCTACA TCAAAAAAGT AGAAAAGCCA GGCGCAGTGG CTCATGCCTG TAATCCCAGC ACTTTGGGAG -10854 
GCCAAGGCGG GCAGATCGCC ■ TGAGGTCAGG AGTTCGAGAC CAGCCTGACC AACACAGAGA AACCTTGTCG -10784 
CTACTAAAAA TACAAAATTA GCTGGGCATG GTGGCACATG CCTGTAATCC CAGCTACTCG GGAGGCTGAG -10714 
GCAGGATAAC CGCTTGAACC CAGGAGGTGG AGGTTGCGGT GAGCCGGGAT TGCGCCATTG GACTCCAGCC -10644 
TGGGTAACAA GAGTGAAACC CTGTCTCAAG AAAAAAAAAA AAGTAGAAAA ACTTAAAAAT ACAACCTAAT -1057 4 
GATGCACCTT AAAGAACTAG AAAAGCAAGA GCAAACTAAA CCTAAAATTG GTAAAAGAAA AGAAATAATA -10504 
AAGATCAGAG CAGAAATAAA TGAAACTGAA AGATAACAAT ACAAAAGATC AACAAAATTA AAAGTTGGTT -10434 
TTTTGAAAAG ATAAACAAAA TTGACAAACC TTTGCCCAGA CTAAGAAAAA AGGAAAGAAG ACCTAAATAA -10364 
ATAAAGTCAG AGATGAAAAA AGAGACATTA CAACTGATAC CACAGAAATT CAAAGGATCA CTAGAGGCTA -10294 
CTATGAGCAA CTGTACACTA ATAAATTGAA AAACCTAGAA AAAATAGATA AATTCCTAGA TGCATACAAC -10224 
CTACCAAGAT TGAACCATGA AGAAATCCAA AGCCCAAACA GACCAATAAC AATAATGGGA TTAAAGCCAT -10154 
AATAAAAAGT CTCCTAGCAA AGAGAAGCCC AGGACCCAAT GGCTTCCCTG CTGGATTTTA CCAATCATTT -10084 
AAAGAAGAAT GAATTCCAAT CCTACTCAAA CTATTCTGAA AAATAGAGGA AAGAATACTT CCAAACTCAT -10014 
TCTACATGGC CAGTATTACC CTGATTCCAA AACCAGACAA AAACACATCA AAAACAAACA AACAAAAAAA -9944 
CAGAAAGAAA GAAAACTACA GGCCAATATC CCTGATGAAT ACTGATACAA AAATCCTCAA CAAAACACTA -9874 
GCAAACCAAA TTAAACAACA CCTTCGAAAG ATCATTCATT GTGATCAAGT GGGATTTATT CCAGGGATGG -9804 
AAGGATGGTT CAACATATGC AAATCAATCA ATGTGATACA TCATCCCAAC AAAATGAAGT ACAAAAACTA -9734 
TATGATTATT TCACTTTATG CAGAAAAAGC ATTTGATAAA ATTCTGCACC CTTCATGATA AAAACCCTCA -9664 
AAAAACCAGG TATACAAGAA ACATACAGGC CAGGCACAGT GGCTCACACC TGCGATCCCA GCACTC7GGG -9594 
AGGCCAAGGT GGGATGATTG CTTGGGCCCA GGAGTTTGAG ACTAGCCTGG GCAACAAAAT GAGACCTGGT -9524 
CTACAAAAAA CTTTTTTAAA AAATTAGCCA GGCATGATGG CATATGCCTG TAGTCCCAGC TAGTCTGGAG -9454 
GCTGAGGTGG GAGAATCACT TAAGCCTAGG AGGTCGAGGC TGCAGTGAGC CATGAACATG TCACTGTACT -9384 
CCAGCCTAGA CAACAGAACA AGACCCCACT GAATAAGAAG AAGGAGAAGG AGAAGGGAGA AGGGAGGGAG -9314 
AAGGGAGGAG GAGGAGAAGG AGGAGGTGGA GGAGAAGTGG AAGGGGAAGG GGAAGGGAAA GAGGAAGAAG -9244 
AAGAAACATA TTTCAACATA ATAAAAGCCC TATATGACAG ACCGAGGTAG TATTATGAGG AAAAACTGAA -9174 
AGCCTTTCCT CTAAGATCTG GAAAATGACA AGGGCCCACT TTCACCACTG TGATTCAACA TAGTACTAGA -9104 
AGTCCTAGCT AGAGCAATCA GATAAGAGAA AGAAATAAAA GGCATCCAAA CTGGAAAGGA AGAAGTCAAA -9034 
TTATCCTGTT TGCAGATGAT ATGATCTTAT ATCTGGAAAA GACTTAAGAC ACCACTAAAA AACTATTAGA -8964 
GCTGAAATTT GGTACAGCAG GATACAAAAT CAATGTACAA AAATCAGTAG TATTTCTATA TTCCAACAGC -8894 
AAACAATCTG AAAAAGAAAC CAAAAAAGCA GCTACAAATA AAATTAAACA GCTAGGAATT AACCAAAGAA -8824 
GTGAAAGATC TCTACAATGA AAACTATAAA ATGTTGATAA AAGAAATTGA AGAGGGCACA AAAAAAGAAA -8754 
AGATATTCCA TGTTCATAGA TTGGAAGAAT AAATACTGTT AAAATGTCCA TACTACCCAA AGCAATTTAC -8684 
AAATTCAATG CAATCCCTAT TAAAATACTA ATGACGTTCT TCACAGAAAT AGAAGAAACA ATTCTAAGAT -8614 
TTGTACAGAA CCACAAAAGA CCCAGAATAG CCAAAGCTAT CCTGACCAAA AAGAACAAAA CTGGAAGCAT -8544 
CACATTACCT GACTTCAAAT TATACTACAA AGCTATAGTA ACCCAAACTA CATGGTACTG GCATAAAAAC -8474 
AGATGAGACA TGGACCAGAG GAACAGAATA GAGAATCCAG AAACAAATCC ATGCATCTAC AGTGAACTCA -84 04 
TTTTTGACAA AGGTGCCAAG AACATACTTT GGGGAAAAGA TAATCTCTTC AATAAATGGT GCTGGAGGAA -8334 
CTGGATATCC ATATGCAAAA TAACAATACT AGAACTCTGT CTCTCACCAT ATACAAAAGC AAATCAAAAT -8264 
GGATGAAAGG CTTAAATCTA AAACCTCAAA CTTTGCAACT ACTAAAAGAA AACACCGGAG AAACTCTCCA -8194 
GGACATTGGA GTGGGCAAAG ACTTCTTGAG TAATTCCCTG CAGGCACAGG CAACCAAAGC AAAAACAGAC -8124 
AAATGGGATC ATATCAAGTT AAAAAGCTTC TGCCCAGCAA AGGAAACAAT CAACAAAGAG AAGAGACAAC -8054 
CCACAGAATG GGAGAATATA TTTGCAAACT ATTCATCTAA CAAGGAATTA ATAACCAGTA TATATAAGGA -7984 
GCTCAAACTA CTCTATAAGA AAAACACCTA ATAAGCTGAT TTTCAAAAAT AAGCAAAAGA TCTGGGTAGA -7914 
CATTTCTCAA AATAAGTCAT ACAAATGGCA AACAGGCATC TGAAAATGTG CTCAACACCA CTGATCATCA -784 4 
GAGAAATGCA AATCAAAACT ACTATGAGAG AT CAT CT CAT CCCAGTTAAA ATGGCTTTTA TTCAAAAGAC -7774 
AGGCAATAAC AAATGCCAGT GAGGATGTGG ATAAAAGGAA ACCCTTGGAC ACTGTTGGTG GGAATGGAAA -7704 
TTGCTACCAC TATGGAGAAC AGTTTGAAAG TTCCTCAAAA AACTAAAAAT AAAGCTACCA TACAGCAATC -7634 
CCATTGCTAG GTATATACTC CAAAAAAGGG AATCAGTGTA TCAACAAGCT ATCTCCACTC CCACATTTAC -7564 
TGCAGCACTG TTCATAGCAG CCAAGGTTTG GAAGCAACCT CAGTGTCCAT CAACAGACGA ATGGAAAAAG -7494 
AAAATGTGGT GCACATACAC AATGGAGTAC TACGCAGCCA TAAAAAAGAA TGAGATCCTG TCAG TTGCAA -7424 
CAGCATGGGG GGCACTGGTC AGTATGTTAA GTGAAATAAG CCAGGCACAG AAAGACAAAC TTTTCATGTT -7354 
CTCCCTTACT TGTGGGAGCA AAAATTAAAA CAATTGACAT AGAAATAGAG GAGAATGGTG GTTCTAGAGG -7284 
GGTGGGGGAC AGGGTGACTA GAGTCAACAA TAATTTATTG TATGTTTTAA AATAACTAAA AGAGTATAAT -7214 
TGGGTTGTTT GTAACACAAA GAAAGGATAA ATGCTTGAAG GTGACAGATA CCCCATTTAC CCTGATGTGA -7144 
TTATTACACA TTGTATGCCT GTATCAAAAT ATCTCATGTA TGCTATAGAT ATAAACCCTA CTATATTAAA -7074 
AATTAAAATT TTAATGGCCA GGCACGGTGG CTCATGTCCG TAATCCCAGC ACTTTGGGAG GCCGAGGCGG -7004 
GTGGATCACC TGAGGTCAGG AGTTTGAAAC CAGTCTGGCC ACCATGATGA AACCCTGTCT CTACTAAAGA -6934 
TACAAAAATT AGCCAGGCGT GGTGGCACAT ACCTGTAGTC CCAACTACTC AGGAGGCTGA GACAGGAGAA -6864 
TTGCTTGAAC CTGGGAGGCG GAGGTTGCAG TGAGCCGAGA TCATGCCACT GCA CTGCA GC CTGGGTGACA -6794 
GAGCAAGACT CCATCTCAAA ACAAAAACAA AAAAAAGAAG ATTAAAATTG TAATTTTTAT GTACCGTATA -6724 
AATATATACT CTACTATATT AGAAGTTAAA AATTAAAACA ATTATAAAAG GTAATTAACC ACTTAATCTA -6654 
AAATAAGAAC AATGTATGTG GGGTTTCTAG CTTCTGAAGA AGTAAAAGTT ATGGCCACGA TGGCAGAAAT -6584 
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GTGAGGAGGG AACAGTGGAA GTTACTGTTG TTAGACGCTC ATACTCTCTG TAAGTGACTT AATTTTAACC -6514 
AAAGACAGGC TGGGAGAAGT TAAAGAGGCA TTCTATAAGC CCTAAAACAA CTGCTAATAA TGGTGAAAGG -6444 
TAATCTCTAT TAATTACCAA TAATTACAGA TATCTCTAAA ATCGAGCTGC AGAATTGGCA CGTCTGATCA -6374 
CACCGTCCTC TCATTCACGG TGCTTTTTTT CTTGTGTGCT TGGAGATTTT CGATTGTGTG TTCGTGTTTG -6304 
GTTAAACTTA ATCTGTATGA ATCCTGAAAC GAAAAATGGT GGTGATTTCC TCCAGAAGAA TTAGAGTACC -6234 
TGGCAGGAAG CAGGTGGCTC TGTGGACCTG AGCCACTTCA ATCTTCAAGG GTCTCTGGCC AAGACCCAGG -6164 
TGCAAGGCAG AGGCCTGATG ACCCGAGGAC AGGAAAGCTC GGATGGGAAG GGGCGATGAG AAGCCTGCCT -6094 
CGTTGGTGAG CAGCGCATGA AGTGCCCTTA TTTACGCTTT GCAAAGATTG CTCTGGATAC CATCTGGAAA -6024 
AGGCGGCCAG CGGGAATGCA AGGAGTCAGA AGCCTCCTGC TCAAACCCAG GCCAGCAGCT ATGGCGCCCA -5954 
CCCGGGCGTG TGCCAGAGGG AGAGGAGTCA AGGCACCTCG AAGTATGGCT TAAATCTTTT TTTCACCTGA -5B84 
AGCAGTGACC AAGGTGTATT CTGAGGGAAG CTTGAGTTAG GTGCCTTCTT TAAAACAGAA AGTCATGGAA -5814 
GCACCCTTCT CAAGGGAAAA CCAGACGCCC GCTCTGCGGT CATTTACCTC TTTCCTCTCT CCCTCTCTTG -5744 
CCCTCGCGGT TTCTGATCGG GACAGAGTGA CCCCCGTGGA GCTTCTCCGA GCCCGTGCTG AGGACCCTCT -5674 
TGCAAAGGGC TCCACAGACC CCCGCCCTGG AGAGAGGAGT CTGAGCCTGG CTTAATAACA AACTGGGATG -5604 
TGGCTGGGGG CGGACAGCGA CGGCGGGATT CAAAGACTTA ATTCCATGAG TAAATTCAAC CTTTCCACAT -5534 
CCGAATGGAT TTGGATTTTA TCTTAATATT TTCTTAAATT TCATCAAATA ACATTCAGGA CTGCAGAAAT -5464 
CCAAAGGCGT AAAACAGGAA CTGAGCTATG TTTGCCAAGG TCCAAGGACT TAATAACCAT GTTCAGAGGG -5394 
ATTTTTCGCC CTAAGTACTT TTTATTGGTT TTCATAAGGT GGCTTAGGGT GCAAGGGAAA GTACACGAGG -5324 
AGAGGCCTGG GCGGCAGGGC TATGAGCACG GCAGGGCCAC CGGGGAGAGA GTCCCCGGCC TGGGAGGCTG -5254 
ACAGCAGGAC CACTGACCGT CCTCCCTGGG AGCTGCCACA TTGGGCAACG CGAAGGCGGC CACGCTGCGT -5184 
GTGACTCAGG ACCCCATACC GGCTTCCTGG GCCCACCCAC ACTAACCCAG GAAGTCACGG AGCTCTGAAC -5114 
CCGTGGAAAC GAACATGACC CTTGCCTGCC TGCTTCCCTG GGTGGGTCAA GGGTAATGAA GTGGTGTGCA -5044 
GGAAATGGCC ATGTAAATTA CACGACTCTG CTGATGGGGA CCGTTCCTTC CATCATTATT CATCTTCACC -4 974 
CCCAAGGACT GAATGATTCC AGCAACTTCT TCGGGTGTGA CAAGCCATGA CAAAACTCAG TACAAACACC -4904 
ACTCTTTTAC TAGGCCCACA GAGCACGGSC CACACCCCTG ATATATTAAG AGTCCAGGAG AGATGAGGCT -4 834 
GCTTTCAGCC ACCAGGCTGG GGTGACAACA GCGGCTGAAC AGTCTGTTCC TCTAGACTAG TAGACCCTGG -4764 
CAGGCACTCC CCCAGATTCT AGGGCCTGGT TGCTGCTTCC CGAGGGCGCC ATCTGCCCTG GAGACTCAGC -4694 
CTGGGGTGCC ACACTGAGGC CAGCCCTGTC TCCACACCCT CCGCCTCCAG GCCTCAGCTT CTCCAGCAGC -4624 
TTCCTAAACC CTGGGTGGGC CGTGTTCCAG CGCTACTGTC TCACCTGTCC CACTGTGTCT TGTCTCAGCG -4554 
ACGTAGCTCG CACGGTTCCT CCTCACATGG GGTGTCTGTC TCCTTCCCCA ACACTCACAT GCGTTGAAGG -4484 
GAGGAGATTC TGCGCCTCCC AGACTGGCTC CTCTGAGCCT GAACCTGGCT CGTGGCCCCC GATGCAGGTT -4414 
CCTGGCGTCC GGCTGCACGC TGACCTCCAT TTCCAGGCGC TCCCCGTCTC CTGTCATCTG CCGGGGCCTG -4344 
CCGGTGTGTT CTTCTGTTTC TGTGCTCCTT TCCACGTCCA GCTGCGTGTG TCTCTGCCCG CTAGGGTCTC -4274 
GGGGTTTTTA TAGGCATAGG ACGGGGGCGT GGTGGGCCAG GGCGCTCTTG GGAAATGCAA CATTTGGGTG -4204 
TGAAAGTAGG AGTGCCTGTC CTCACCTAGG TCCACGGGCA CAGGCCTGGG GATGGAGCCC CCGCCAGGGA -4134 
CCCGCCCTTC TCTGCCCAGC ACTTTCCTGC CCCCCTCCCT CTGGAACACA GAGTGGCAGT TTCCACAAGC -4064 
ACTAAGCATC CTCTTCCCAA AAGACCCAGC ATTGGCACCC CTGGACATTT GCCCCACAGC CCTGGGAATT -3994 
c-Mvc 

|CACGTG| VCTA CGCACATCAT GTACACACTC CCGTCCACGA CCGACCCCCG CTGTTTTATT TTAATAGCTA -3924 
CAAAGCAGGG AAATCCCTGC TAAAATGTCC TTTAACAAAC TGGTTAAACA AACGGGTCCA TCCGCACGGT -3854 
GGACAGTTCC TCACAGTGAA GAGGAACATG CCGTTTATAA AGCCTGCAGG CATCTCAAGG GAATTACGCT -3784 
GAGTCAAAAC TGCCACCTCC ATGGGATACG TACGCAACAT GCTCAAAAAG AAAGAATTTC ACCCCATGGC -3714 
AGGGGAGTGG TTAGGGGGGT TAAGGACGGT GGGGGCGGCA GCTGGGGGCT ACTGCACGCA CCTTTTACTA -3644 
AAGCCAGTTT CCTGGTTCTG ATGGTATTGG CTCAGTTATG GGAGACTAAC CATAGGGGAG TGGGGATGGG -3574 
GGAACCCGGA GGCTGTGCCA TCTTTGCCAT GCCCGAGTGT CCTGGGCAGG ATAATGCTCT AGAGATGCCC -3504 
ACGTCCTGAT TCCCCCAAAC CTGTGGACAG AACCCGCCCG GCCCCAGGGC CTTTGCAGGT GTGATCTCCG -3434 
TGAGGACCCT GAGGTCTGGG ATCCTTCGGG ACTACCTGCA GGCCCGAAAA GTAATCCAGG GGTTCTGGGA -3364 
AGAGGCGGGC AGGAGGGTCA GAGGGGGGCA GCCTCAGGAC GATGGAGGCA GTCAGTCTGA GGCTGAAAAG -3294 
GGAGGGAGGG CCTCGAGCCC AGGCCTGCAA GCGCCTCCAG AAGCTGGAAA AAGCGGGGAA GGGACCCTCC -3224 
ACGGAGCCTG CAGCAGGAAG GCACGGCTGG CCCTTAGCCC ACCAGGGCCC ATCGTGGACC TCCGGCCTCC -3154 
GTGCCATAGG AGGGCACTCG CGCTGCCCTT CTAGCATGAA GTGTGTGGGG ATTTGCAGAA GCAACAGGAA -3084 
ACCCATGCAC TGTGAATCTA GGATTATTTC AAAACAAAGG TTTACAGAAA CATCCAAGGA CAGGGCTGAA -3014 
GTGCCTCCGG GCAAGGGCAG GGCAGGCACG AGTGATTTTA TTTAGCTATT TTATTTTATT TACTTACTTT -2944 
CTGAGACAGA GTTATGCTCT TGTTGCCCAG GCTGGAGTGC AGCGGCATGA TCTTGGCTCA CTGCAACCTC -2874 
CGTCTCCTGG GTTCAAGCAA TTCTCGTGCC TCAGCCTCCC AAGTAGCTGG GATTTCAGGC GTGCACCACC -2804 
ACACCCGGCT AATTTTGTAT TTTTAGTAGA GATGGGCTTT CACCATGTTG GTCAAGCTGA TCTCAAAATC -2734 
CTGACCTCAG GTGATCCGCC CACCTCAGCC TCCCAAAGTG CTGGGATTAC AGGCATGAGC CACTGCACCT -2664 
GGCCTATTTA ACCATTTTAA AACTTCCCTG GGCTCAAGTC ACACCCACTG GTAAGGAGTT CATGGAGTTC -2594 
AATTTCCCCT TTACTCAGGA GTTACCCTCC TTTGATATTT TCTGTAATTC TTCGTAGACT GGGGATACAC -2524 
CGTCTCTTGA CATATTCACA GTTTCTGTGA CCACCTGTTA TCCCATGGGA CCCACTGCAG GGGCAGCTGG -2454 
GAGGCTGCAG GCTTCAGGTC CCAGTGGGGT TGCCATCTGC CAGTAGAAAC CTGATGTAGA ATCAGGGCGC -2384 
AAGTGTGGAC ACTGTCCTGA ATCTCAATGT CTCAGTGTGT GCTGAAACAT GTAGAAATTA AAGTCCATCC -2314 
CTCCTACTCT ACTGGGATTG AGCCCCTTCC CTATCCCCCC CCAGGGGCAG AGGAGTTCCT CTCACTCCTG -2244 
TGGAGGAAGG AATGATACTT TGTTATTTTT CACTGCTGGT ACTGAATCCA CTGTTTCATT TGTTGGTTTG -2174 
TTTGTTTTGT TTTGAGAGGC GGTTTCACTC TTGTTGCTCA GGCTGGAGGG AGTGCAATGG CGCGATCTTG -2104 
GCTTACTGCA GCCTCTGCCT CCCAGGTTCA AGTGATTCTC CTGCTTCCGC CTCCCATTTG GCTGGGATTA -2034 
CAGGCACCCG CCACCATGCC CAGCTAATTT TTTGTATTTT TAGTAGAGAC GGGGGTGGGT GGGGTTCACC -1964 
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ATGTTGGCCA GGCTGGTCTC GAACTTCTGA CCTCAGATGA TCCACCTGCC TCTGCCTCCT AAAGTGCTGG -1894 
GATTACAGGT GTGAGCCACC ATGCCCAGCT CAGAATTTAC TCTGTTTAGA AACATCTGGG TCTGAGGTAG -1824 

CAAT-Box 

GAAGCTCACC CCACTCAAGT GTTGTGGTGT T-TTAf (GCCAA~Tb ATAGAATT TTTTTATTGT TGTTAGAACA -1754 

CTCTTGATGT TTTACACTGT GATGACTAAG ACATCATCAG CTTTTCAAAG ACACACTAAC TGCACCCATA -1684 

ATACTGGGGT GTCTTCTGGG TATCAGCAAT CTTCATTGAA TGCCGGGAGG CGTTTCCTCG CCATGCACAT -1614 

GGTGTTAATT ACTCCAGCAT AATCTTCTGC TTCCATTTCT TCTCTTCCCT CTTTTAAAAT TGTGTTTTCT -154 4 

ATGTTGGCTT CTCTGCAGAG AACCAGTGTA AGCTACAACT TAACTTTTGT TGGAACAAAT TTTCCAaXccI -1474 
Spi 1 — 1 

[GCCCj CTTTGC CCTAGTGGCA GAGACAATTC ACAAACACAG CCCTTTAAAA AGGCTTAGGG ATCACTAAGG -14 04 

GGATTTCTAG AAGAGCGACC TGTAATCCTA AGTATTTACA AGACGAGGCT AACCTCCAGC GAGCGTGACA -1334 

GCCCAGGGAG GGTGCGAGGC CTGTTCAAAT GCTAGCTCCA TAAATAAAGC AATTTCCTCC GGCAGTTTCT -1264 

GAAAGTAGGA AAGGTTACAT TTAAGGTTGC GTTTGTTAGC ATTTCAGTGT TTGCCGACCT CAGCTACAGC -1194 

ATCCCTGCAA GGCCTCGGGA GACCCAGAAG TTTCTCGCCC CCTTAGATCC AAACTTGAGC AACCCGGAGT -1124 

CTGGATTCCT GGGAAGTCCT CAGCTGTCCT GCGGTTGTGC CGGGGCCCCA GGTCTGGAGG GGACCAGTGG -1054 

CCGTGTGGCT TCTACTGCTG GGCTGGAAGT CGGGCCTCCT AGCTCTGCAG TCCGAGGCTT GGAGCCAGGT -984 

GCCTGGACCC CGAGGCTGCC CTCCACCCTG TGCGGGCGGG ATGTGACCAG ATGTTGGCCT CATCTGCCAG -914 

ACAGAGTGCC GGGGCCCAGG GTCAAGGCCG TTGTGGCTGG TGTGAGGCGC CCGGTGCGCG GCCAGCAGGA -844 
CCAC-Box Spi 

GCGCCTGGCT CCATTl jcCCA CCCfr TTCTCG ACGGGAc jcGC CCCfc iGTGGGT GATTAACAGA TTTGGGGTGG -774 

TTTGCTCATG GTGGGGACCC CTCGCCGCCT GAGAACCTGC AAAGAGAAAT GACGGGCCTG TGTCAAGGAG -704 

CCCAAGTCGC GGGGAAGTGT TGGAGGGAGG CACTCCGGGA GGTCCCGCGT GCCCGTCCAG GGAGCAATGC -634 
AP-2 

GTCCTCGGGT TCC ^TCCCCAG CCC£ GTCTAC GCGCCTCCGT CCTCCCCTTC ACGTCCGGCA TTCGTGGTGC -564 

CCGGAGCCCG ACGCCCCGCG TCCGGACCTG GAGGCAGCCC TGGGTCTCCG GATCAGGCCA GCGGCCAAAG -4 94 

GGTCGCCGCA CGCACCTGTT CCCAGGGCCT CCACATCATG GCCCCTCCCT CGGGTTACCC CACAGCCTAG -424 

Spi 

GCCGATTCGA CCTCTCTCCG CTGGGGCCCT CGCTGGCGTC CCTGCACCCT GGGAGCGCGA GCGGC ^CGCG] -354 

Spi 

[GGCC^ GGGAAG CGCGGCCCAG ACCCCCGGGT jCCGCCfl GGAG CAGCTGCGCT GTCGGGGCCA GGCCGGGCTC -284 

CCAGTGGATT CGCGGGCACA GACGCCCAGG ACCGCGCTCC qCACGTGpCG GAGGGACTGG GGACCCGGGC -214 

5pi 

ACCCGTCCTG CCCCTTCACC TTCCAGCTCC GCCTCCTCCG CGCGGACdCC GCCCfcGTCCC GACCCCTCCC -144 

Spl 

GGGTCCCCGG CCCAGCCCCC TCCGGGCCCT CCCAGCCC CT CCCCTTCCTT TCCGCGGCCfc CGCCClrCTCC -74 

c-Mvc 

TCGCGGCGCG AGTTT CAGGC AGCGCTGCGT CCTGCTGC qC ACGTGfr GAAG CCCTGGCCCC GGCCACCCCC -4 

GCGAXG 3 
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SEQUENZPROTOKOLL 

<110> Bayer AG 

<120> Regulatorische DNA-Sequenzen aus der Si -Region vom Gen 
der humanen katalytischen Telomerase-Untereinheit und 
deren diagnose ische und therapeutische Verwendung 

<130> LeA32805-Ausland 

<140> 
<141> 

<160> 20 

<170> Patentln Vers. 2.0 

<210> 1 
<211> 5126 
<212> DNA 

<213> Homo sapiens 
<400> 1 

gagecctgaa ccgcggaaac gaacacgacc cttgcctgcc cgcttccctg ggcgggtcaa 60 
gggtaatgaa gtggcgtgca ggaaatggcc atgtaaatta cacgactctg ctgatgggga 120 
ccgttccttc catcattatt catcttcacc cccaaggacc gaatgattcc agcaacttct 180 
ecgggtgtga caagecatga caaaactcag tacaaacacc actcttttac taggcccaca 240 
gagcaeggge cacacccccg atatattaag agtccaggag agatgaggee gctttcagcc 300 
accaggctgg ggegacaaca geggctgaac agtctgttcc tctagactag tagaccctgg 360 
caggcactcc cccaaatcct agggcctggt tgctgctccc cgagggcgcc atccgccctg 420 
gagacccagc ccggggcgcc acactgaggc cagccctgtc tccacaccct ccgcctccag 4 80 
gcctcagctt ctccagcagc ttcctaaacc ctgggtgggc cgtgttccag cgctactgtc 540 
ccacctgtcc cactgtgtct tgtcccagcg aegtagcteg cacggttcct cctcacacgg 600 
ggtgtctgtc cccttcccca acactcacat gcgttgaagg gaggagattc tgcgcctccc 660 
agactggccc ctctgagcct gaacctggct cgcggccccc gatgeaggtt cctggcgtcc 720 
ggctgcacgc tgacctccat ttccaggcgc tccccgtctc ctgtcatctg ccggggcccg 780 
ccggcgtgtt cttctgtttc tgtgctcctt tccacgtcca gccgcgtgtg tctctgcccg 840 
ccagggtctc ggggttttta taggcatagg aegggggegt ggtgggccag ggcgctcttg 900 
ggaaatgcaa catttgggtg tgaaagtagg agtgcctgtc ctcacctagg tccacgggca 960 
caggcctggg gatggagece ccgccaggga cccgcccttc tctgcccagc actttcctgc 1020 
ccccctccct ctggaacaca gageggcagt ttccacaagc accaagcacc ctcttcccaa 1080 
aagacccagc attggcaccc ccggacattc gccccacagc cctgggaatt caegtgacta 1140 
cgcacatcat gtacacactc ccgtccacga ccgacccccg ctgttttatt ttaatagcta 1200 
caaagcaggg aaatccctgc taaaatgtcc tttaacaaac eggctaaaca aacgggtcca 1260 
tccgcacggc ggacagttcc teacagegaa gaggaacacg ccgtttataa agectgeagg 1320 
catctcaagg gaattacgee gagecaaaac tgccacctcc atgggatacg tacgeaacat 13 80 
gctcaaaaag aaagaatttc accccatggc aggggagtgg ctaggggggt taaggacggt 144 0 
gggggeggea gctgggggct actgcacgca ccttttacta aagccagttt cctggttctg 1500 
acggcaccgg cccagttatg ggagaccaac cataggggag tggggatggg ggaacccgga 1560 
ggctgtgcca tctctgccat gcccgagtgt cctgggcagg acaatgetet agagacgccc 1620 
aegtcctgat tcccccaaac ctgtggacag aacccgcccg gccccagggc etttgeaggt 1680 
gtgatctccg tgaggaccct gaggtceggg atectteggg actacctgca ggcccgaaaa 1740 
gtaatccagg ggccctggga agaggeggge aggagggtca gaggggggca gcctcaggac 1800 
gatggaggca gtcagtctga ggctgaaaag ggagggaggg cctcgagccc aggectgeaa 1860 
gcgcctccag aagctggaaa aagcggggaa gggaccctcc aeggagectg cagcaggaag 1920 
geaeggctgg cccctagccc accagggccc accgcggacc tccggcctcc gtgecatagg 1980 
agggcactcg cgctgccctt ctagcatgaa gcgtgtgggg atttgeagaa gcaacaggaa 2040 
acccatgcac tgtgaatcta ggattatttc aaaacaaagg tttacagaaa catccaagga 2100 
cagggctgaa gtgcctccgg gcaagggcag ggcaggcacg agtgatttta tttagctatt 2160 
ttattttatt cacttacttt ctgagacaga gttatgetet tgttgcccag gctggagtgc 2220 
ageggcatga tcttggctca ctgcaacccc cgtctcctgg gttcaagcaa ctcccgtgcc 2280 
tcagcctccc aagtagctgg gatttcaggc gtgcaccacc acacccggct aattttgtat 2340 
tttcagtaga gatgggcttt caccatgttg gtcaagctga tctcaaaatc ctgacctcag 2400 
gtgacccgcc caccccagcc ccccaaagtg cegggattae aggcatgagc cactgcacct 24 60 
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ggcctattta accattttaa aacttccctg ggctcaagtc acacccactg gtaaggagtt 2520 
catggagttc aatttcccct ttactcagga gtcaccctcc tttgatattt tctgtaattc 2580 
ttcgtagact ggggatacac cgtctcttga catattcaca gtttctgtga ccacccgtta 2640 
tcccatggga cccactgcag gggcagctgg gaggccgcag gcctcaggtc ccagtggggt 2700 
tgccatccgc cagtagaaac ctgatgtaga atcagggcgc aagcgtggac actgtcctga 2760 
atctcaatgt ctcagtgtgt gccgaaacat gtagaaatta aagtccatcc ctcctaccct 2820 
actgggattg agccccttcc ctatcccccc ccaggggcag aggagttcct ctcactcctg 2880 
tggaggaagg aatgatactt tgttattttt cactgctggt actgaatcca ctgtttcatt 2940 
tgttggtttg tttgttttgt tttgagaggc ggtttcactc ttgttgctca ggctggaggg 3000 
agcgcaatgg cgcgaccttg gcttactgca gcctctgcct cccaggttca agtgattctc 3060 
ctgcttccgc ctcccatttg gctgggatta caggcacccg ccaccatgcc cagctaattt 3120 
tttgtatttt tagtagagac gggggtgggt ggggttcacc atgttggcca ggctggtctc 3180 
gaacttccga ccccagatga tccacctgcc tctgcctcct aaagtgctgg gattacaggt 3240 
gtgagccacc atgcccagct cagaatttac tccgtttaga aacacctggg tctgaggcag 3300 
gaagctcacc ccactcaagt gttgtggtgt tttaagccaa tgatagaatt tttttattgt 3360 
cgtcagaaca ctcttgatgt tttacactgt gatgactaag acatcatcag cttttcaaag 3420 
acacactaac tgcacccata atactggggt gtcttctggg tatcagcaat cttcattgaa 34 80 
cgccgggagg cgtttcctcg ccatgcacat ggtgttaatt actccagcat aatcttctgc 3540 
ccccacttct tctctcccct cttctaaaat tgtgttttcc atgttggctt ctctgcagag 3600 
aaccagtgta agctacaact taacctttgt tggaacaaat tttccaaacc gcccctttgc 3660 
cccagtggca gagacaattc acaaacacag ccctttaaaa aggcctaggg atcactaagg 3720 
ggatctctag aagagcgacc tgcaatccta agtatttaca agacgaggct aacctccagc 3780 
gagcgcgaca gcccagggag ggtgcgaggc ctgttcaaat gctagctcca taaataaagc 3 840 
aatttcctcc ggcagtttct gaaagtagga aaggttacat ttaaggctgc gtttgttagc 3 900 
atttcagtgt ttgccgacct cagctacagc atccctgcaa ggcctcggga gacccagaag 3 960 
tttcccgccc ccctagatcc aaacttgagc aacccggagt ctggattcct gggaagccct 4020 
cagctgccct gcggttgtgc cggggcccca ggtctggagg ggaccagtgg ccgtgtggct 4080 
tctaccgctg ggctggaagt cgggcctcct agctctgcag tccgaggctt ggagccaggt 4140 
gcctggaccc cgaggccgcc ctccaccctg tgcgggcggg atgtgaccag atgttggcct 4200 
catctgccag acagagtgcc ggggcccagg gtcaaggccg ttgtggctgg cgtgaggcgc 4260 
ccggtgcgcg gccagcagga gcgcctggct ccatttccca ccctttctcg acgggaccgc 4320 
cccggtgggt gattaacaga ttcggggtgg tttgcccatg gtggggaccc ctcgccgcct 4380 
gagaacctgc aaagagaaat gacgggcctg tgtcaaggag cccaagtcgc ggggaagtgt 4440 
cgcagggagg cactccggga ggtcccgcgt gcccgtccag ggagcaatgc gtcctcgggt 4500 
ccgtccccag ccgcgtctac gcgcctccgt cctccccttc acgtccggca ttcgtggtgc 4560 
ccggagcccg acgccccgcg tccggacctg gaggcagccc tgggtctccg gatcaggcca 4620 
gcggccaaag ggccgccgca cgcacctgct cccagggcct ccacatcatg gcccctccct 4680 
cgggttaccc cacagcctag gccgattcga cctctctccg ctggggccct cgctggcgtc 4740 
cccgcacccc gggagcgcga gcggcgcgcg ggcggggaag cgcggcccag acccccgggt 4 800 
ccgcccggag cagctgcgct gtcggggcca ggccgggccc ccagtggatt cgcgggcaca 4860 
gacgcccagg accgcgctcc ccacgcggcg gagggactgg ggacccgggc acccgtcctg 4 920 
ccccttcacc ctccagctcc gcctcctccg cgcggacccc gccccgtccc gacccctccc 4980 
gggtccccgg cccagccccc tccgggccct cccagcccct ccccttcctt tccgcggccc 5040 
cgccctctcc ccgcggcgcg agttccaggc agcgctgcgc cctgctgcgc acgtgggaag 5100 
ccctggcccc ggccaccccc gcgatg 5126 

<210> 2 

<211> 4042 

<212> DNA 

<213> Homo sapiens 



<400> 2 

gttccaggca gcgctgcgtc ctgctgcgca 
cgatgccgcg cgctccccgc tgccgagccg 
aggtgctgcc gctggccacg ttcgtgcggc 
agcgcgggga cccggcggct ttccgcgcgc 
gggacgcacg gccgcccccc gccgccccct 
tggtggcccg agtgctgcag aggctgtgcg 
gcttcgcgct gctggacggg gcccgcgggg 
gcagccacct gcccaacacg gtgaccgacg 
cgccgcgccg cgtgggcgac gacgtgctgg 
tgctggtggc tcccagctgc gcctaccagg 
ctgccaccca ggcccggccc ccgccacacg 
aacgggcctg gaaccatagc gtcagggagg 
gtgcgaggag gcgcgggggc agtgccagcc 



cgtgggaagc cctggccccg gccacccccg 60 
tgcgceccct gctgcgcagc cactaccgcg 120 
gcctggggcc ccagggctgg cggctggtgc 180 
cggtggccca gtgcctggtg cgcgtgccct 240 
ccctccgcca ggtgtcctgc ctgaaggagc 300 
agcgcggcgc gaagaacgtg ctggccttcg 360 
gcccccccga ggccttcacc accagcgtgc 420 
caccgcgggg gagcggggcg tgggggctgc 4 80 
tccacccgct ggcacgccgc gcgctctttg 540 
tgtgcgggcc gccgctgtac cagcccggcg 600 
ccagcggacc ccgaaggcgt ctgggatgcg 66 0 
ccggggtccc cctgggcccg ccagccccgg 720 
gaagtctgcc gttgcccaag aggcccaggc 780 
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gtggcgctgc ccctgagccg gagcggacgc ccgttgggca ggggtcctgg gcccacccgg 840 
gcaggacgcg tggaccgagt gaccgtggtc tctgtgtggt gtcacccgcc agacccgccg 900 
aagaagccac ctctttggag ggtgcgctct ctggcacgcg ccactcccac ccatccgtgg 960 
gccgccagca ccacgcgggc cccccatcca cat eg egg cc accacgtccc tgggacaege 1020 
cttgtccccc ggtgtacgcc gagaccaagc acttcctcca ctccccaggc gacaaggagc 1080 
agctgcggcc ctccttccta ctcagctctc tgaggcccag cctgactggc geteggagge 1140 
tcgtggagac catctttctg ggttccaggc cctggacgcc agggactccc cgcaggttgc 1200 
cccgcctgcc ccagcgctac tggcaaatgc ggcccctgtt cctggagctg cttgggaacc 1260 
aegegcagtg cccctacggg gtgctcctca agaegcactg cccgctgcga getgeggtea 1320 
ccccagcagc cggtgtctgt gecegggaga agccccaggg ctctgtggcg gcccccgagg 1380 
aggaggacac agacccccgt cgcctggtgc agctgctccg ccagcacagc agcccccggc 1440 
aggtgtacgg ettegtgegg gcctgcctgc gccggctggt gcccccaggc ctctggggct 1500 
ccaggcacaa cgaacgccgc ttcctcagga acaccaagaa gttcatctcc ctggggaagc 1560 
atgecaaget ctcgccgcag gagctgaege ggaagacgag cgcgcgggac tgcgcttggc 1620 
tgegcaggag cccaggggtt ggctgcgctc cggccgcaga gcaccgtctg cgegaggaga 1680 
tcctggccaa gttcctgcac tggctgacga gcgcgtacgt cgtcgagctg ctcaggtcct 1740 
tcctttatgt cacggagacc acgtttcaaa agaacaggee ctttttctac eggaagagtg 1800 
tctggagcaa getgeaaage attggaacca gacagcactt gaagagggcg cagctgeggg 1860 
agccgccgga ageagaggee aggcagcacc gggaagccag gcccgccctg ctgacgtcca 1920 
gactccgctt cacccccaag cctgacgggc tgeggecgat tgtgaacatg gaccacgccg 1980 
tgggagccag aacgttccgc agagaaaaga gggccgagcg ccccaccccg agggtgaagg 2040 
cactgtccag cgtgctcaac tacgageggg cgcggcgccc cggcctcctg ggcgcctctg 2100 
tgctgggccc ggacgatatc cacagggcct ggcgcacctt cgtgctgcgt gtgcgggccc 2160 
aggacccgcc gcccgagccg tact teg tea aggtggatgt gaegggegeg cacgacacca 2220 
tcccccagga caggcccacg gaggtcatcg ccagcatcat caaaccccag aacaegtact 2280 
gcgtgcgtcg gtatgccgtg gtccagaagg ccgcccatgg gcacgtccgc aaggecttea 2340 
agagecaegt ctctaccttg acagacctcc agccgcacat gcgacagttc gcggctcacc 24 00 
egcaggagae cagcccgctg agggatgecg tegtcatega gcagagctcc tccccgaatg 2460 
aggecagcag tggcctcttc gacgtctccc cacgcttcat gtgccaccac gccgtgcgca 2520 
tcaggggcaa gtcctacgtc cagtgecagg ggatcccgca gggctccatc ctctccacgc 2580 
tgctctgcag cctgtgctac ggcgacatgg agaacaagct gtttgcgggg atteggeggg 264 0 
aegggctget cctgcgtttg gtggatgatt tcttgttggt gacaccccac cccacccacg 2700 
cgaaaacctt cctcaggacc ctggtccgag gtgtccctga gtatggctgc gtggtgaact 2760 
tgeggaagae agtggtgaac ttccctgtag aagacgaggc cctgggtggc aeggcttttg 2820 
ttcagatgee ggcccacggc ctatccccct ggtgcggcct getgetggat acccggaccc 2880 
tggaggegea gagegactae tccagctacg cccggacctc catcagagcc agtctcacct 2 940 
tcaaccgcgg cttcaaggct gggaggaaca tgcgtcgcaa actctttggg gtcttgegge 3000 
tgaagtgtca cagcctgttt ctggatttgc aggtgaacag cctccagacg gtgtgcacca 3 060 
acatctacaa gatcctcctg ccgcaggcgc acaggcttca cgcatgtgtg ctgcagctcc 3120 
catttcatca gcaagtttgg aagaacccca catttctcct gcgcgtcatc cctgacacgg 3180 
cccccctctg ccactccatc ctgaaageca agaaegcagg gatgtcgctg ggggecaagg 324 0 
gcgccgccgg ccctctgccc tccgaggccg tgeagegget gtgccaccaa gcactcctgc 33 00 
tcaagctgac tcgacaccgt gtcacctacg tgccactcct ggggtcactc aggacagccc 3360 
agaegcaget gagteggaag ctcccgggga cgacgctgac tgccctggag gccgcagcca 3420 
acccggcact gccctcagac ttcaagacca tcctggactg acggccaccc gcccacagcc 34 80 
aggecgagag cagacaccag cagccctgtc acgccgggct ctacgtccca gggagggagg 354 0 
ggcggcccac acccaggccc gcaccgctgg gagtctgagg cctgagtgag tgtttggccg 3600 
aggectgeat gtccggctga aggctgagtg teeggctgag gectgagega gtgtccagcc 3660 
aagggctgag tgtccagcac acctgccgtc tccacttccc cacaggctgg cgcccggctc 3720 
caccccaggg ccagctcccc cccaccagga gcccggcttc cactccccac ataggaatag 37 80 
tccaccccca gattcgecat tgttcacccc tcgccctgcc cccctttgcc ctccaccccc 3840 
accatccagg tggagaccct gagaaggacc ctgggagctc tgggaatttg gagtgaccaa 3 900 
aggcgtgccc tgtacacagg cgaggaccct gcacctggat gggggtccct gtgggtcaaa 3960 
ttggggggag gtgctgtggg agtaaaatac tgaatatatg agtttctcag ctctgaaaaa 4020 
aaaaaaaaaa aaaaaaaaaa aa 4042 

<210> 3 
<211> 11276 
<212> DNA 

<213> Homo sapiens 
<400> 3 

acttgagccc aagagttcaa ggctacggtg agecatgatt gcaacaccac acgccagcct 60 
tggtgacaga acgagaccct gtctcaaaaa aaaaaaaaaa aattgaaata atataaagca 120 
tcttctctgg ccacagtgga acaaaaccag aaatcaacaa caagaggaac tttgaaaact 180 
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atacaaacac atgaaaatta aacaacacac 
ttaaaaagga aattgaaaaa tttatttaag 
acccacggta cacagcaaaa gcagtgctaa 
tcaaaaaagt agaaaagcca ggcgcagtgg 
gccaaggcgg gcagatcgcc tgaggtcagg 
aaccttgtcg ctaccaaaaa tacaaaatta 
cage tact eg ggaggctgag gcaggataac 
gagcegggae tgcgccactg gaccccagcc 
aaaaaaaaaa aagtagaaaa actcaaaaac 
aaaagcaaga gcaaactaaa cctaaaattg 
cagaaacaaa tgaaactgaa agacaacaac 
ctttgaaaag ataaacaaaa ttgacaaacc 
acctaaataa ataaagtcag agatgaaaaa 
caaaggatca ctagaggcta ctatgagcaa 
aaaatagata aattcctaga tgcatacaac 
agcccaaaca gaccaataac aataatggga 
agagaagece aggacccaac ggcctccctg 
gaattccaat cctactcaaa ctattctgaa 
tctacatggc cagtattacc ctgattccaa 
aacaaaaaaa cagaaagaaa gaaaactaca 
aaatcctcaa caaaacacta gcaaaccaaa 
gtgatcaagt gggatttatt ccagggatgg 
atgtgataca tcatcccaac aaaatgaagt 
cagaaaaagc atttgataaa actctgcacc 
tatacaagaa acatacaggc caggcacagt 
aggecaagge gggatgattg cttgggccca 
gagacctggc ctacaaaaaa cttttttaaa 
tagtcccagc tagtctggag gctgaggtgg 
tgcagtgagc catgaacatg tcactgtact 
gaataagaag aaggagaagg agaagggaga 
aggaggtgga ggagaagtgg aaggggaagg 
tttcaacata ataaaagece tatatgacag 
agcctttcct ctaagatctg gaaaatgaca 
tagtactaga agtcctagct agagcaatca 
ctggaaagga agaagtcaaa ttatcctgtt 
gactcaagac accactaaaa aactattaga 
caatgtacaa aaatcagtag tatttctata 
caaaaaagca gctacaaata aaattaaaca 
tctacaatga aaactataaa atgttgacaa 
agatattcca tgtccataga ttggaagaat 
agcaatttac aaattcaatg caatccctat 
agaagaaaca attctaagat ttgtacagaa 
cctgaccaaa aagaacaaaa ctggaagcat 
agctatagta acccaaacta catggtactg 
gaacagaaca gagaatccag aaacaaaccc 
aggtgccaag aacatacttt ggggaaaaga 
ccggatatcc atatgeaaaa taacaatact 
aaatcaaaat ggatgaaagg cttaaatcta 
aacaceggag aaactcccca ggacattgga 
caggcacagg caaccaaagc aaaaacagac 
cgcccagcaa aggaaacaat caacaaagag 
tttgeaaact attcatctaa caaggaatta 
ctctataaga aaaacaccta ataagctgat 
catttctcaa aataagtcat acaaatggca 
ctgatcatca gagaaatgea aatcaaaact 
atggctttta ttcaaaagac aggcaataac 
acccttggac actgttggtg ggaatggaaa 
ttcctcaaaa aactaaaaat aaagccacca 
caaaaaaggg aaccagtgta tcaacaagct 
ttcatagcag ccaaggcttg gaagcaaccc 
aaaatgtggt gcacacacac aatggagtac 
tcagttgcaa cagcatgggg ggcactggtc 
aaagacaaac ttttcatgtt ctcccttact 
agaaatagag gagaaeggtg gttctagagg 
taatttattg tatgttttaa aacaaccaaa 



ttctgaatga ccagtgagtc aatgaagaaa 240 
caaatgataa eggaaacata acctctcaaa 300 
gaaggaagtt tatagctata agcagctaca 360 
ctcatgcctg taatcccagc actttgggag 420 
agttcgagac cagcctgacc aacacagaga 480 
gctgggcatg gtggcacatg cctgtaaccc S4 0 
cgcttgaacc caggaggtgg aggttgegge 600 
tgggtaacaa gagtgaaacc ctgtctcaag €60 
acaacctaat gatgeacett aaagaaccag 720 
gtaaaagaaa agaaataata aagatcagag 780 
acaaaagatc aacaaaatta aaagttggtt 840 
tttgeccaga ccaagaaaaa aggaaagaag 900 
agagacatta caactgatac cacagaaact 960 
ctgcacacta ataaattgaa aaacctagaa 1020 
ctaccaagat tgaaccatga agaaacccaa 1080 
ttaaagecat aataaaaagt ctcctagcaa 1140 ' 
ceggatttta ccaaccattt aaagaagaac 1200 
aaatagagga aagaataccc ccaaactcat 1260 
aaccagacaa aaacacatca aaaacaaaca 1320 
ggecaatate cctgatgaat aetgatacaa 1380 
ttaaacaaca ccttcgaaag atcattcatt 1440 
aaggatggtt caacatatgc aaatcaatca IS 00 
acaaaaacta tatgattatt tcactttatg 1560 
ctccacgata aaaaccctca aaaaaccagg 1620 
ggctcacacc tgcgatccca gcactccggg 1680 
ggagcttgag actagectgg gcaacaaaat 1740 
aaattageca ggcatgatgg catatgectg 1800 
gagaatcact taageccagg aggtcgaggc 1860 
ccagcctaga caacagaaca agaccccact 1920 
agggagggag aagggaggag gaggagaagg 1980 
ggaagggaaa gaggaagaag aagaaacata 204 0 
accgaggtag tattatgagg aaaaactgaa 2100 
agggcccact ttcaccactg tgattcaaca 2160 
gataagagaa agaaataaaa ggcatccaaa 2220 
tgcagatgat atgatcttat atctggaaaa 2280 
gctgaaactt ggtacagcag gatacaaaat 2340 
ttccaacagc aaacaatctg aaaaagaaac 2400 
gctaggaatt aaccaaagaa gtgaaagatc 24 60 
aagaaattga agagggcaca aaaaaagaaa 2S20 
aaacactgtt aaaatgtcca tactacccaa 2580 
taaaatacta atgacgttct tcacagaaat 2640 
ccacaaaaga cccagaatag ccaaagctat 270 0 
cacattacct gacttcaaat tatactacaa 2760 
gcataaaaac agatgagaca tggaccagag 2820 
atgeatctae agtgaactca tttttgacaa 2880 
taatctcttc aataaatggt gctggaggaa 2940 
agaactctgc ctctcaccat atacaaaagc 3000 
aaacctcaaa etttgeaact accaaaagaa 3060 
gtgggcaaag actccttgag taattccctg 3120 
aaatgggatc atatcaagtt aaaaagcttc 3180 
aagagacaac ccacagaatg ggagaacata 3240 
ataaccagta tatataagga gctcaaacta 33 00 
tttcaaaaat aagcaaaaga tctgggtaga 3360 
aacaggcatc tgaaaatgtg ctcaacacca 3420 
actatgagag atcatctcat cccagtcaaa 3480 
aaatgccagt gaggatgtgg ataaaaggaa 3540 
ttgccaccac tatggagaac agtttgaaag 3600 
tacagcaatc ecattgetag gtacatactc 3660 
atctccactc ccacatttac tgcagcactg 3720 
cagtgtccac caacagacga atggaaaaag 3780 
tacgcagcca taaaaaagaa tgagatcctg 3840 
agtacgttaa gtgaaataag ccaggcacag 3900 
tgtgggagca aaaattaaaa caattgacac 3960 
ggtgggggac agggtgacta gagtcaacaa 4020 
agagcataat tgggttgttt gtaacacaaa 4080 
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gaaaggataa atgcttgaag gtgacagata ccccatctac cctgatgtga tcattacaca 4140 
ttgtatgcct gcaccaaaac atctcatgta tgctatagat ataaacccta ctatattaaa 4200 
aattaaaatt ttaatggcca ggcacggtgg ctcacgcccg taaccccagc actttgggag 4260 
gccgaggcgg gcggatcacc tgaggtcagg agtccgaaac cagcccggcc accaegatga 4320 
aaccctgcct ctactaaaga cacaaaaact agccaggcgc ggtggcacat acctgcagcc 4380 
ccaactactc aggaggctga gacaggagaa ttgcttgaac ctgggaggcg gaggttgcag 4440 
tgagccgaga ccatgccact gcactgcagc ctgggtgaca gagcaagact ccatctcaaa 4500 
acaaaaacaa aaaaaagaag attaaaattg taatttttat gtaccgtata aatatatact 4560 
ccactatatt agaagttaaa aaccaaaaca actataaaag gtaaccaacc acttaatcta 4620 
aaataagaac aatgtatgtg gggtttctag cttctgaaga agtaaaagtt acggccacga 4680 
tggcagaaat gcgaggaggg aacagtggaa gctactgttg ttagacgctc acactctctg 4740 
taagtgactt aattttaacc aaagacaggc tgggagaagt taaagaggca ttccataagc 4 800 
cccaaaacaa ctgccaataa tggtgaaagg taatctctat taattaccaa taattacaga 4860 
tatetetaaa atcgagctgc agaattggca cgtctgatca caccgtcctc teat tea egg 4920 
tgcttttttt cttgtgtgct tggagatttt cgattgtgtg ttcgtgtetg gctaaactta 4980 
atctgtatga accccgaaac gaaaaatggt ggtgatttcc tccagaagaa ttagagtacc 5040 
tggcaggaag caggtggctc tgtggacctg agccacctca atcttcaagg gcctctggcc 5100 
aagacccagg tgcaaggcag aggectgatg acccgaggac aggaaagctc ggatgggaag 5160 
gggegatgag aagcctgcct cgttggtgag cagegcatga agtgccctta tttacgcttt 5220 
gcaaagatcg ctctggatac catceggaaa aggeggecag egggaatgea aggagtcaga 5280 
agcctcctgc tcaaacccag gccagcagct atggcgccca cccgggcgtg tgccagaggg 5340 
agaggagtca aggcacctcg aagtatggct taaatctttt tttcacctga agcagtgacc 5400 
aaggtgtatt ctgagggaag cttgagttag gtgccttctc taaaacagaa agccatggaa 54 60 
gcacccccct caagggaaaa ccagacgccc getctgeggt catttacctc tttcctctct 5520 
ccctctcttg ccctcgcggt etctgategg gaeagagega cccccgtgga gcccctccga 5580 
gcccgtgccg aggaccctcc tgeaaaggge tccacagacc cccgccctgg agagaggagt 5640 
ctgagcctgg cttaataaca aactgggatg tggctggggg eggacagega eggegggatt 5700 
caaagactta attccatgag taaattcaac ctttccacat ccgaatggat ttggattcta 5760 
tcttaatatt ttcttaaatt tcatcaaata acattcagga ctgcagaaat ecaaaggegt 5820 
aaaacaggaa ctgagctatg tttgecaagg tccaaggact taataaccac gttcagaggg 58 80 
atttttcgee ctaagtactt tttattggtt ttcacaaggt ggcttagggc gcaagggaaa 5940 
gtacacgagg agaggectgg geggcaggge tatgagcacg gcagggccac eggggagaga 6000 
gtccccggcc tgggaggctg acagcaggac cactgaccgt cctceetggg agctgccaca 6060 
ttgggcaacg egaaggegge cacgctgcgt gtgactcagg accccatacc ggcttcctgg 6120 
gcccacccac actaacccag gaagecaegg agctctgaac ccgtggaaac gaacatgacc 6180 
cttgcctgcc tgcttccctg ggtgggtcaa gggtaacgaa gtggtgtgca ggaaatggcc 624 0 
atgtaaatta cacgactctg ctgatgggga ccgttccttc catcattatt catcttcacc 6300 
cccaaggacc gaatgattcc agcaacttct tcgggtgtga caagecatga caaaactcag 6360 
tacaaacacc actcttttac taggcccaca gagcaeggsc cacacccctg atatattaag 6420 
agtccaggag agatgaggct gctttcagcc accaggctgg ggtgacaaca geggctgaac 6480 
agtctgctcc tctagaccag tagaccctgg caggcactcc cccagattct agggectgge 654 0 
tgctgcctcc cgagggcgcc acctgccctg gagactcagc ctggggtgcc acactgaggc 6600 
cagccctgtc tccacaccct ccgcctccag gcctcagctt ctccagcagc ttcctaaacc 6660 
ctgggtgggc cgtgttccag cgctactgtc tcacctgtcc cactgtgtcc cgtctcagcg 6720 
acgtagcccg cacggttcct cctcacatgg ggtgcctgtc tccttcccca acactcacat 6780 
gcgttgaagg gaggagattc tgcgcctccc agactggctc ctccgagcct gaacctggct 6840 
cgtggccccc gatgeaggtt cctggcgtcc ggctgcacgc tgacctccat ttccaggcgc 690 0 
tccccgtctc ctgtcatctg ccggggcctg ccggtgtgtt cttctgtctc tgtgctcctt 6960 
tccacgtcca gctgcgtgtg tctctgcccg ctagggtctc ggggttttta taggcatagg 7020 
aegggggegt ggt'gggccag ggcgctcttg ggaaatgcaa catttgggtg tgaaagtagg 7080 
agtgcctgtc ctcacctagg tccacgggca caggcctggg gatggagece ccgccaggga 7140 
cccgcccccc tccgcccagc actttcctgc ccccctccct ctggaacaca gagtggcagt 7200 
ttccacaagc actaagcatc ctcttcccaa aagacccagc attggcaccc ctggacattt 7260 
gccccacagc cctgggaatt caegtgacta cgcacatcat gtacacaccc ccgtccacga 7320 
ccgacccccg ccgttttatt ctaatagcta caaagcaggg aaatccctgc taaaatgtcc 73 80 
tttaacaaac tggttaaaca aacgggtcca tccgcacggt ggacagttcc tcacagtgaa 7440 
gaggaacacg ccgtttataa agectgeagg catctcaagg gaattacget gagtcaaaac 7500 
tgccacctcc atgggatacg tacgeaacat gctcaaaaag aaagaatttc accccatggc 7560 
aggggagtgg ttaggggggt taaggacggt gggggeggea gctgggggct actgcacgca 7620 
ccttttacta aagccagttc cctggttctg atggtattgg ctcagttatg ggagactaac 7680 
cataggggag tggggatggg ggaacccgga ggctgcgcca cctttgccat gcccgagtgt 7740 
cctgggcagg ataatgetet agagatgece aegtcctgat tcccccaaac ctgtggacag 7800 
aacccgcccg gccccagggc etttgeaggt gcgatctccg tgaggaccct gaggtctggg 7860 
atectteggg actacctgca ggcccgaaaa gtaatccagg ggttctggga agaggeggge 7920 
aggagggtca gaggggggca gcctcaggac gatggaggca gtcagtctga ggctgaaaag 7980 
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ggagggaggg cctcgagccc aggcctgcaa gcgcctccag aagctggaaa aagcggggaa 8040 
gggaccctcc acggagcctg cagcaggaag gcacggccgg cccttagccc accagggccc 8100 
atcgtggacc tccggcctcc gtgccatagg agggcactcg cgctgccctt ctagcatgaa 8160 
gtgtgtgggg atttgcagaa gcaacaggaa acccatgcac egtgaatcta ggattatttc 8220 
aaaacaaagg tttacagaaa catccaagga cagggccgaa gcgcctccgg gcaagggcag 8280 
ggcaggcacg agtgatttta tttagctatt ttattttatt tacttacttt ctgagacaga 834 0 
gttatgctct cgctgcccag gctggagtgc agcggcatga tctcggctca ctgcaacctc 84 00 
cgtctcctgg gttcaagcaa ttctcgtgcc tcagcccccc aagcagccgg gatttcaggc 8460 
gtgcaccacc acacccggct aattttgtac ttttagtaga gatgggcttt caccatgttg 8520 
gtcaagctga tctcaaaatc etgacctcag gcgacccgcc caccccagcc tcccaaagcg 8580 
ctgggattac aggcatgagc cactgcaccc ggcccattta accattttaa aacttccctg 8640 
ggctcaagtc acacccactg gtaaggagct catggagttc aatttcccct tcactcagga 8700 
gttaccctcc tttgatattt cctgtaattc ttcgtagact ggggacacac cgtctcttga 8760 
catattcaca gtttctgtga ccacctgtca tcccacggga cccactgcag gggcagccgg 8820 
gaggctgcag gcttcaggcc ccagtggggt tgccatctgc cagtagaaac ctgatgtaga 8880 
atcagggcgc aagtgtggac actgtcctga atctcaatgt ctcagtgtgt gctgaaacat 8940 
gcagaaatta aagtccatcc ctcctactct accgggattg agccccttcc ccatcccccc 9000 
ccaggggcag aggagttcct ctcactcctg cggaggaagg aatgatactt tgttattttt 9060 
cactgctggt actgaatcca ctgtttcact tgttggtttg tttgttctgt cttgagaggc 9120 
ggtttcactc ttgttgctca ggctggaggg agtgcaatgg cgcgatcttg gcttactgca 9180 
gcctctgccc cccaggttca agtgattctc ctgcttccgc ctcccatttg gctgggatta 9240 
caggcacccg ccaccatgcc cagctaattt tttgtatttt tagtagagac gggggtgggt 9300 
ggggttcacc acgttggcca ggccggtctc gaacttctga cctcagatga tccacccgcc 9360 
tctgcctcct aaagcgctgg gattacaggt gtgagccacc, atgcccagct cagaatttac 9420 
tctgtttaga aacacctggg tctgaggcag gaagctcacc ccactcaagt gttgtggtgt 9480 
tctaagccaa tgatagaact tctttatcgt cgttagaaca ctcttgatgt tttacactgt 9540 
gatgactaag acatcatcag cttttcaaag acacactaac tgcacccata atactggggt 9600 
gtcttccggg tatcagcaat cttcattgaa tgccgggagg cgtttcctcg ccacgcacac 9660 
ggtgttaatt actccagcat aatcttctgc ttccatttct tctcttccct cttttaaaac 9720 
tgtgttttct atgttggctt ctctgcagag aaccagtgta agctacaacc caactttcgt 9780 
tggaacaaat cccccaaacc gcccctr.tgc cctagtggca gagacaattc acaaacacag 9840 
ccctttaaaa aggcttaggg atcactaagg ggatttetag aagagcgacc tgtaatccta 9900 
agtacttaca agacgaggct aacctccagc gagcgtgaca gcccagggag ggtgcgaggc 9960 
ctgtccaaat gctagctcca taaataaagc aacttcctcc ggcagtttct gaaagtagga 10020 
aaggtcacac ttaaggttgc gtttgttagc atttcagtgt ttgccgacct cagccacagc 10080 
atccccgcaa ggcctcggga gacccagaag tttctcgccc ccttagatcc aaacccgagc 1014 0 
aacccggagt ctggattcct gggaagtcct cagctgtccc gcggtcgtgc cggggcccca 10200 
ggcctggagg ggaccagtgg ccgtgtggct tctactgctg ggccggaagt cgggcctcct 10260 
agctctgcag tccgaggctt ggagccaggt gcctggaccc cgaggctgcc ctccaccctg 10320 
cgcgggcggg atgtgaccag atgtcggcct catccgccag acagagtgcc ggggcccagg 10380 
gtcaaggccg ccgtggccgg tgtgaggcgc ccggcgcgcg gccagcagga gcgcctggct 1044 0 
ccatttccca ccctttctcg acgggaccgc cccggtgggt gattaacaga tttggggtgg 10500 
tttgctcatg gcggggaccc ctcgccgcct gagaacctgc aaagagaaat gacgggcctg 10560 
tgtcaaggag cccaagtcgc ggggaagtgt tgcagggagg cactccggga ggtcccgcgt 10620 
gcccgtccag ggagcaatgc gtcctcgggt tcgtccccag ccgcgtctac gcgcctccgt 10680 
cctccccttc acgtccggca ttcgtggtgc ccggagcccg acgccccgcg tccggacctg 10740 
gaggcagccc tgggtctccg gatcaggcca gcggccaaag ggtcgccgca cgcacctgtt 10800 
cccagggccc ccacatcatg gcccctccct cgggttaccc cacagcctag gccgattcga 10860 
cccctctccg ctggggccct cgctggcgtc cctgcaccct gggagcgcga gcggcgcgcg 10920 
ggcggggaag cgcggcccag acccccgggt ccgcccggag cagctgcgct gtcggggcca 10980 
ggccgggctc ccagtggatt cgcgggcaca gacgcccagg accgcgctcc ccacgcggcg 11040 
gagggactgg ggacccgggc acccgtcctg cccctccacc ttccagctcc gcctcctccg moo 
cgcggacccc gccccgtccc gacccctccc gggtccccgg cccagccccc cccgggccct 11160 
cccagcccct ccccttcctt tccgcggccc cgccctctcc ccgcggcgcg agtttcaggc 11220 
agcgctgcgt cctgccgcgc acgtgggaag ccctggcccc ggccaccccc gcgacg 11276 

<210> 4 
<211> 104 
<212> DNA 

<213> Homo sapiens 
<400> 4 

gtgggcctcc ccggggtcgg cgtccggctg gggtcgaggg cggccggggg gaaccagcga 60 
cacgcggaga gcagcgcagg cgacccaggg cgctcccccc gcag 104 
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<210> S 

<211> 8616 

<212> DNA 

<213> Homo sapiens 

<400> 5 

gtgaggaggt ggtggccgtc gagggcccag gccccagagc tgaatgcagt aggggctcag 60 
aaaagggggc aggcagagcc ccggtcctcc tgtctccatc gccacgtggg cacacgtggc 120 
ttttcgctca ggacgtcgag tggacacggt gatctctgcc tccgctctcc ctcctgtcca 180 
gtttgcataa acttacgagg ttcaccttca cgttttgatg gacacgcggt ttccaggcgc 240 
cgaggccaga gcagtgaaca gaggaggctg ggcgcggcag tggagccggg ttgccggcaa 300 
tggggagaag tgtctggaag cacagacgct ctggcgaggg tgcctgcagg ttacctataa 360 
tcctcttcgc aatttcaagg gtgggaatga gaggcgggga cgagaacccc ctcttcctgg 420 
gggtgggagg taagggtttt gcaggtgcac gtggccagcc aatatgcagg tttgtgttta 480 
agatttaatt gtgcgttgac ggccaggtgc ggtggcccac gccggcaatc ccagcacttt 540 
gggaagctga ggcaggtgga tcaectgagg tcaggagttt gagaccagcc tgaccaacat 600 
ggtgaaaccc tatctgtact aaaaatacaa aaattagctg ggcatggtgg tgtgtgcctg 660 
taatcccagc tacttgggag gctgaggcag gagaatcact tgaacccagg aggeggagge 720 
tgcagtgagc tgagattgtg ccattgtact ccagcctggg cgacaagagt gaaactccgt 780 
ctttaaaaaa aaaaagtgtt cgttgattgt gecaggacag ggtagaggga gggagataag 840 
actgttctcc agcacagatc ctggccccat ctccaggcat gaagagggee acatgggagc 900 
agaggacagc agatggctcc acctgccgag gaagggacag tgtttgtggg tgttcagggg 960 
atggtgctgc tgggccctgc cgtgtcccca ccctgttttt ctggatttga tgttgaggaa 1020 
cctccgctcc agcccccttt tggctcccag tgctcccagg ccctaccgcg gcagctagaa 1080 
gaagtcccga tttcaccccc tccccacaaa ctcccaagac atgtaagacc tccggccatg 1140 
cagacaagga gggtgaccct cttggggctc ttttttttct ttttttcttt ttatggtggc 1200 
aaaagtcata taacatgaga ttggcactcc taacaccgtc ttctgtgtac agtgcagaat 1260 
tgetaactcg gcggtgctta cagcaggttg ettgaaatge tgcgtcttgc gtgactggaa 1320 
gtccctaccc ategaaegge agctgcctca cacccgctgc ggctcaggtg gaccacgccg 1380 
agtcagataa gegtcatgea acccagtttt gctttttgtg ctccagcttc ettegttgag 1440 
gagagtttga gttctctgat caggactctg cctgtcattg ctgttctctg acttcagatg 1S00 
aggtcacaat ctgcccctgg ettatgeagg gagegaggeg tggtccccgg gtgtccctgt 1560 
caegtgeagg gtgagtgagg cgttgccccc aggtgtccct gccacgtgta gggtgagtga 1620 
ggcgcggccc ccgggtgtcc ccgtcccgcg cagegtgatt gaggtgegge ccccgggtgt 1680 
ccctgtcacg tgtagggtga gtgaggegee acccccgggt gtccctgtca cgtgtagggt 1740 
gagtgaggcg cggcccccgg gtgtccctgt cccgtgcagg gtgagtgagg cactgtcccc 1800 
gggtgtccct gtcacgtgca gggtgagtga ggcgcggtcc ccgggtgtcc ctctcaggtg 1860 
tagggtgagt gaggegegge cccagggtgt ccctgtcacg tgtagggtga gtgaggcacc 1920 
gtccctgggt gtccctccca ggtatagggt gagtgaggca ctgtccccgg gtgtccctgt 1980 
caegtgeagg gtgagtgagg cgcggccccc gggtgtccct etcaggtgea gggtgagtga 204 0 
ggcgctgtcc ctgggtgtcc ctgtctcgtg tagggtgagt gaggctctgt ccccaggcgt 2100 
ccttggcgtt tgctcacttg agcttgctcc tgaatgtttg ctctttctat agccacagct 2160 
gcgccggttg cccattgcct gggtagatgg tgeaggegea gtgctggtcc ccaagcctat 2220 
cttttctgat gctcggctct tcttggtcac ctctccgttc cattttgeta eggggacacg 2280 
ggactgeagg ctctcgcctc ccgcgtgcca ggcactgcag ccacagcttc aggtccgett 2340 
gcctctgttg ggcctggctt gctcaccacg tgcccgccac atgcatgctg ccaatactcc 2400 
tctcccagct tgtctcatgc cgaggctgga ctctgggctg cctgtgtctg ctgccacgtg 2460 
ttgctggaga catcccagaa agggttctct gtgccctgaa ggaaagcaag tcaccccagc 2520 
cccctcactt gtcctgtttt ctcccaagct gcccctctgc ttggccccct tgggtgggtg 2S80 
geaaegcttg tcaccttatt ctgggcacct gccgctcatt gcttaggctg ggctctgcct 2640 
ccagtcgccc cctcacatgg attgaegtec agecacaggt tggagtgtct ctgtctgtct 2700 
cctgctctga gacccacgtg gagggceggt gtctccgcca gccttcgtca gacttccctc 2760 
ttgggtctta gttttgaatt tcactgattt acctctgacg tttctatctc tccattgtat 2820 
gctttttctt ggtttattct ttcattcctt ttctagcttc ttagtttagt catgcctttc 2880 
cctctaagtg ctgccttacc tgcaccctgt gttttgatgt gaagtaatct caacatcagc 294 0 
cactttcaag tgttcttaaa atacttcaaa gtgttaatac ttcttttaag tattcttatt 3000 
ctgtgatttt tttctttgtg cacgctgtgt tttgacgtga aatcattttg atatcagtga 3060 
cttttaagta ttctttagct tattctgtga tttctttgag cagtgagtta tttgaacact 3120 
gtttatgttc aagatatgta gagtatcaag ataegtagag tattttaagt tatcatttta 3180 
ttattgattt ctaactcagt tgtgtagtgg tctgtataat accaattatt tgaagtttgc 3240 
ggagccttgc tttgtgatct agtgtgtgca tggtttccag aactgtccat tgtaaatttg 3300 
acatcctgtc aatagtgggc atgcatgttc actatatcca gcttattaag gtccagtgca 33 60 
aagcttctgt ctccttctag atgcatgaaa ttccaagaag gaggecatag tccctcacct 3420 
gggggatggg tctgttcatt tettctegtt tggtagcatt tatgtgaggc attgttaggt 3480 
geatgeaegt ggtagaattt ttatcttcct gatgagtgaa tcttttggag acttctatgt 3540 
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ctctagtaat ctagtaattc tttttttaaa ttgctcttag tactgccaca ctgggcttct 3 600 
tttgattagt attttcctgc tgtgtctgtt ttctgccttt aatttatata tatatatata 3 660 
tttttttttt ttttgagaca gagtcctggt ccgtcgccca gggcgagcgc agtggtgtga 3720 
tcacaggtca gtgtaacttt taccttctgg cctgagccgt cctctcacct cagcctcctg 3780 
agtagctgga actgcagaca cgcaccgcca cacctggcta atttttaaat tttttctgga 3 840 
gacagggtct tgctgtgttg cccaggctgg tctcaaactc ttggacccaa gggatccatc 3 900 
tacctcggct tcccaaagtg ctgaattaca ggcatgagcc accatgtctg gcctaatttt 3 960 
caacactttt atattcttat agtgtgggta tgtcctgtta acagcatgta ggtgaatttc 4020 
caatccagtc tgacagtcgt tgtttaactg gataacccga tttattttca tttttttgtc 4080 
accagagacc cgcctggtgc actctgattc tccacttgcc tgttgcatgt cctcgttccc 4140 
ttgtttctca ccacctcttg ggttgccatg tgcgtttcct gccgagtgtg tgttgatcct 4200 
cccgttgcct cctggtcact gggcatttgc ttttatttct ctttgcttag tgttaccccc 4260 
cgatcttttt accgtcgctg tctgctctcg tttatcgaga cagtctcacc ctgccaccca 4320 
ggctggagtg taatggcaca atctcggctc accgcaacct ccgcctcctc ggttcaagca 4380 
gttctcattc ctcaacctca tgagtagctg ggattacagg cgcccaccac cacgcctggc 4440 
taatttttgt atttttagta gagataggct ttcaccatgt tggccaggct ggtctcaaac 4500 
tcctgacctc aagtgatctg cccgccttgg cctcccacag tgctgggatt acaggtgcaa 4560 
gccaccgtgc ccggcatacc ttgatctttt aaaatgaagt ctgaaacatt gctacccttg 4620 
tcctgagcaa taagaccctt agtgcatttt agctctggcc accccccagc ctgtgtgctg 4680 
ctctccctgc tgacttagtt ctatctcagg catcttgaca cccccacaag ctaagcatta 4740 
ttaatattgt tttccgtgtt gagtgtttct gtagctttgc ccccgccctg cttttcctcc 4800 
tttgttcccc gtctgtcttc cgtctcaggc ccgccgtctg gggtcccctt ccttgtcctt 4 860 
tgcgtggttc ttctgtcttg ttattgctgg taaaccccag ctttacctgt gctggcctcc 4 920 
atggcatcta gcgacgcccg gggacctccg cttatgatgc acagatgaag atgcggagac 4 980 
ccacgaggag ggcggtcatc ttggcccgtg agtgtctgga gcaccacgtg gccagcgttc 5040 
cttagccagt gagtgacagc aacgtccgct cggcccgggt tcagcctgga aaaccccagg 5100 
catgtcgggg tctggtggct ccgcggtgtc gagtttgaaa tcgcgcaaac ctgcggtgtg S160 
gcgccagccc tgacggtgct gcctggcggg ggagtgcctg cttcctccct tctgcttggg 5220 
aaccaggaca aaggatgagg ctccgagccg ttgtcgccca acaggagcat gacgtgagcc 5280 
atgtggataa ttttaaaatt tctaggctgg gcgcggtggc tcacgcctgt aaccccagca 534 0 
ctttgggagg ccaaggcggg tggatcacga ggtcaggagg ccgagaccac cccggccaac 54 00 
atgatgaaac cccatctgta ctaaaaacac aaaaattagc tgggcgtggt ggcgggtgcc 5460 
cgcaatccca gctactcggg aggctgaggc aggagaattg cttgaacctg ggagctggaa 5S20 
gttgcagtga gccgacattg caccactgca ctccagcctg gcaacacagc gagactctgt 5580 
ctcaaaaaaa aaaaaaaaaa aaaaaaaaaa aattctagta gccacactaa aaaagtaaaa 564 0 
aagaaaaggt gaaattaatg taataataga ttttactgaa gcccagcatg tccacacccc 5700 
atcattttag ggtgttattg gtgggagcat cactcacagg acatttgaca tttttcgagc 5760 
tttgtctgcg ggatcccgtg tgtaggtccc gtgcgtggcc atctcggcct ggacctgctg 5820 
ggcttcccat ggccatggct gttgtaccag atggcgcagg tccgggatga ggccgccagg 5880 
ccctcagtga gctggatgtg cagtgtccgg acggtgcacg tctgggatga ggtcgccagg 594 0 
ccctgctgcg agctggatgt gtggtgtctg gatggtgcag gtcaggggtg aggtctccag 6000 
gcccccggcg agccggaggt atggagtccg gatgatgcag gtccggggtg aggtcgccag 6060 
gccccgctgt gagctggatg tgtggtgtct ggatggtgca ggtcaggggt gaggtctcca 6120 
ggcccccggt aagctggagg tatggagtcc ggatgatgca ggtecggggt gaggtcgcca 6180 
ggccctgctg tgagctggat gtgtggtgtc tggatggtgc aggtctgggg tgaggtcacc 6240 
aggccctgcg gtgagctggg tgtgcggcgt ctggatggtg caggtctgga gtgaggtcgc 6300 
cagacggtgc cagaccatgc ggtgagctgg atatgcggtg tccggatggt gcaggtctgg 6360 
ggtgaggttg ccaggccccg ctgcgagttg gatgtggggt gtccggatgc tgcaggtccg 6420 
gcgcgaggcc accaggccct gctgtgagct ggatgtgtgg tgtctggatg gtgcaggtct 64 80 
ggggtgaagg ccgccaggcc cctgcttgtg agctggatgt gtggtgtctg gatggtgcag 6540 
gtctggagtg aggtcgccag gccctcggtg agctggatgt gcagtgtcca gatggtgcag 6600 
gtccggggtg aggtcgccag accctgcggt gagctggatg tgcggtgtct ggatggtgca 6660 
ggtctggagt gaggtcgcca ggccctcggt gagctggatg tatggagtcc ggatggtgcc 6720 
ggtccggggt gaggtcgcca gaccctgctg tgagctggat gtgcggtgtc tggatggtac 6780 
aggtctggag tgaggtcgcc agaccctgct gtgagctgga tatgcggtgt ccggatggtg 684 0 
caggtcaggg gtgaggtctc caggccctcg gtgagctgga ggtatggagt ccggatgatg 6900 
caggtccggg gtgaggtcgc caggccctgc tgtgaactgg atgtgcggcg tctggatggt 6960 
gcaggtctgg ggtgtggtcg ccaggccctc ggtgagctgg aggtatggag tccggatgat 7020 
gcaggtccgg ggtgaggtcg ccaggccctg ctgtgagctg gatgtgcggc gtctggatgg 7080 
tgcaggtctg gggtgtggtc gccaggccct cggtgagctg gaggtatgga gtccggatga 7140 
tgcaggtccg gggtgaggtt gccaggccct gctgtgagct ggatgtgctg tatccggatg 7200 
gtgcagtccg gggtgaggtc gccaggccct gctgtgagct ggatgtgctg tatccggatg 7260 
gtgcaggtct ggggtgaggt caccaggccc tgcggtgagc tggttgtgcg gtgtccggtt 7320 
gctgcaggtc cggggtgagt tcgccaggcc ctcggtgagc tggatgtgcg gtgtccccgt 7380 
gcccggatgg tgcaggtcca gggtgaggtc gctaggccct tggtgggctg gatgtgccgt 7440 
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gtccggatgg tgcaggtctg gggtgaggtc gccaggccct tggtgagctg gatgtgcggt 7500 
gcctgcatgg tgcaggtctg gggtgaggtc gccaggccct tggtgggctg gatgtgtggt 7560 
gtccggatgg tgcaggtccg gcgtgaggtc gccaggccct gctgtgagct ggatgtgcgg 7620 
tgtctggatg gtgcaggtcc ggggtgaggt agccaaggcc ttcggtgagc tggatgtggg 7680 
gtgtccggat ggtgcaggtc cggggtgagg tcgccaggcc ctgcggttag ctggatatgc 7740 
ggtgtccgga tggtgcaggt ccggggtgag gtcaccaggc cctgcggtta gctggatgtg 7800 
cggtgtctgg atggtgcagg tccggggtga ggtcgccagg ccctgctgtg agctggatgt 7860 
gctgtatccg gatggtgcag gtccggggtg aggtcgccag gccctgcagt gagctggatg 7920 
tgctgtatcc ggatggtgca ggtctggcgt gaggtcgcca ggccctgcgg ttagctggat 7 9 BO 
atgcggtgtc ggatggtgca ggtccggggt gaggt caeca ggccctgcgg ttagctggat 8040 
gtgcggtgtc cggatggtgc aggtctgggg tgaggtcgee aggccctgct gtgagctgga 8100 
tgtgctgtat ccggatggtg caggtceggg gtgaggtege caggccctgc ggtgagctgg 8160 
atgtgctgta tccggatggt gcaggtctgg cgtgaggtcg ccaggccctg cggtgagctg 8220 
gatgtgcagt gtacggatgg tgcaggtccg gggtgaggtc gccaggccct gcggtgggct 8260 
gtatgtgtgt tgtctggatg gtgcaggtcc ggggtgagtt cgccaggccc tgcggtgagc 8340 
tggatgtgtg gtgtctggat getgeaggtc cggggtgagt tcgccaggcc cteggtgage 8400 
tggatatgcg gtgtccccgt gtccgaatgg tgcaggtcca gggtgaggtc gccaggccct 8460 
tggtgggctg gatgtgccgt gtccggatgg tgcaggtctg gggtgaggtc gccaggccct 8520 
tggtgagctg gatgtgcggt gtccggatgg tgcaggtccg gggtgaggtc accaggccct 8S80 
cggtgatctg gatgtggcat gtccttctcg tttaag 8616 

<210> 6 
<211> 2089 
<212> DNA 

<213> Homo sapiens 
<400> 6 

gtactgtatc cccacgccag gcctctgctt ctcgaagtcc tggaacacca gcccggcctc 60 
agcatgcgcc tgtctccact tgcctgtgct tccctggctg tgcagctctg ggctgggagc 120 
caggggcccc gtcacaggcc tggtccaagt ggattctgtg caaggctctg actgcctgga 180 
gctcacgttc tcttacttgt aaaatcagga gtttgtgcca agtggtctct agggtttgta 240 
aagcagaagg gatttaaatt agatggaaac actaccacta gcctccttgc ctttccctgg 300 
gatgtgggtc tgattctctc tctctttttt ttttcttttt tgagatggag tctcactctg 360 
ttgcccaggc tggagtgcag tggcataatc ttggctcact gcaacctcca cctcctgggt 4 20 
ttaagegatt caccagcctc agcctcctaa gtagctggga ttacaggcac ctgccaccac 480 
gcctggctaa tttttgtact tttaggagag aeggggttte accatgttgg ccaggctggt 540 
ctcgaactca tgacctcagg tgatccaccc accttggcct cccaaagtgc tgggtttaca 600 
ggctaageca ccgtgcccag cccccgattc tcttttaatt catgctgttc tgtatgaatc 660 
ttcaatctat tggatttagg tcatgagagg ataaaatccc acccacttgg cgactcactg 720 
cagggagcac ctgtgcaggg agcacctggg gataggagag ttccaccatg agctaacttc 780 
taggtggctg catttgaatg gctgtgagat tttgtctgca atgttcggct gatgagagtg 840 
tgagattgtg acagattcaa gctggatttg catcagtgag ggaegggage gctggtctgg 900 
gagatgecag cctggctgag cccaggccat ggtattagct tctccgtgtc ccgcccaggc 960 
tgactgtgga gggctttagt cagaagatca gggcttcccc agctcccctg cacactcgag 1020 
tccctggggg gccttgtgac accccatgcc ccaaatcagg atgtctgcag agggagctgg 1080 
cagcagacct cgtcagaggt aacacagcct ctgggctggg gaccccgacg tggtgctggg 1140 
gccatttcct tgcatctggg ggagggtcag ggctttccct gtgggaacaa gttaatacac 1200 
aatgeacett acttagactt tacaegtatt taatggtgtg cgacccaaca tggtcatttg 1260 
accagtattt tggaaagaat ttaattgggg tgaccggaag gagcagacag acgtggtggt 132 0 
ccccaagatg ctccttgtca ctactgggac tgttgttctg cctggggggc ettggaggee 1380 
cctcctccct ggacagggta ccgtgccttt tctactctgc tgggcctgcg gcctgcggtc 1440 
agggcaccag ctccggagca cccgcggccc cagtgtccac ggagtgccag gctgtcagcc 1500 
acagatgccc aggtccaggt gtggccgctc cagcccccgt gcccccatgg gtggttttgg 1560 
gggaaaaggc caagggcaga ggtgtcagga gactggtggg ctcatgagag ctgattctgc 1620 
tccttggctg agctgccctg agcagcctct cccgccctct ccatctgaag ggatgtggct 1680 
ctttctacct gggggtcctg cctggggcca gecttggget accccagtgg ctgtaccaga 174 0 
gggacaggca tcctgtgtgg aggggcatgg gttcacgtgg ccccagatgc agectgggae 1800 
caggctcccc ggtgctgatg gtgggacagt caccctgggg gttgaccgcc ggactgggcg 1860 
cccccagggt tgactatagg accaggtgtc caggtgccct gcaagtagag gggctctcag 1920 
aggegtctgg ctggcatggg tggacgtggc cccgggcatg gccttcagcg tgtgctgccg 1980 
tgggtgccct gagccctcac tgagtcggtg ggggcttgtg gcttcccgtg agcttccccc 204 0 
tagtctgttg tctggctgag caagcctcct gaggggctct etattgeag 2089 
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<210> 7 

<211> 687 

<212> DNA 

<213> Homo sapiens 



<400> 7 

gcggctgtgc tttggtttaa cttccttttt 

gtatcagctt agatgaaggg cccggaggag 

cggcgccaac ccatttgtgc gcacagtgag 

cagcgcgggg gtgtaggggg agctcctggg 

cagccgggcc agggcctgga tgcagcacgg 

gtgcgcagcc tccgtgcgct tccgcttacg 

agcccaccgg gctctgagga tcctggacct 

ggctgcggtg gctgcggcga ccccgtcatc 

gtgtggcatg aggatcccgt gtgcaacaca 

tctgaggaag ctgggagggg ttctaggccc 

gggctgcttc tcccccgggt ccctacggcg 

gactgtctcc catgctgtcc ccgccag 

<210> 8 

<211> 494 

<212> DNA 

<213> Homo sapiens 



aaacagaagt gcgtttgagc cccacatttg 60 
gggccacggg acacagccag ggccatggca 120 
gtggccgagg tgccggtgcc tccagaaaag 180 
gcagggacag gccctgagga ccacaagaag 240 
cccgaggtcc tggatccgtg ccctgctgtg 300 
gggcccgggg accaggccac gactgccagg 360 
tgccccacgg ctcctgcacc ccacccctgt 420 
tgaggagagt gtggggtgag gtggacagag 480 
catgcggcca ggaacccgtt tcaaacaggg 540 
cgggtctggg tggctgggga cactggggag 600 
gggtgggcac tcggccggac ccactttcct 660 

687 



<400> 8 

gcgggtgccg gggacccccg cgagcagccc 
gcaccccatg ctgggtggag gaggtactcc 
tgtcactgtc gaggacacac ctggcaccta 
catggggccg actgcgcacc ctgactgccc 
gatcccagct tccgtcagag aaggaaccgc 
gcaccccagt cctgagccag gggtctcctg 
ccctgccctt ggggtctgga gtggtggggg 
caggccccga gggcagaggt gatgtctgag 
ctccacccac acag 



tgctggacct tgggagtggc tgcctgatcg 60 
tgggcgggcc gcagggagcg caggtgaccc 120 
gggtggaggc cttcagcctt tcctgcagca 180 
gggctcctat tcccaaggag ggccccactg 240 
aacggctcag ccaccaggcc ccggcgcctc 3 00 
tcctgaggct cagagagggg acacagcccg 360 
tcagagagag agtgggggac accgccaggc 420 
tctctgcgtg gccactgtca gtctcctcgc 480 

494 



c210> 9 

<211> 865 

<212> DNA 

<213> Homo sapiens 



<400> 9 

gtaaggttca cgtgtgacag tcgcgtccag 
agaacgcagt cgtgtctgtg atgcgtttct 
ctgtgatatg cgcgcgcggc acgtgcgtgc 
tgtggtgtgt gtgtgtgtgg cacgtgtgtg 
tgtgtgtgcc tgtgacacgt gcatgttcat 
tttgtggtgc gtgcgtgcat gtgtccgtga 
ggccccttgg ccttactcct ccctcctcca 
ccgggtgctg gtttggggag ctccacattc 
gtcctgtcac agggctgggc cttggagact 
gctggtggta ccctcctgga cccctggcac 
cccatgagat ataggaaggc tgattcaggc 
cggccggggg ccttggggct cggcaggggt 
agtggtcatg agcacgctgg aggggtaagc 
ggtgaagaag tacccctgga gcttcggtct 
acctctttct ctgacttctt gagct 



gatgcgtgtc tctgggatat gaatgtgtct 60 
gtggtggagg cacctccatg attcacacat 120 
cgcggcgcac gtatctgtgg cgtgcatatc 180 
tccatggtgc gtgtgcctgt ggtgtgcatg 240 
gctgtgtgct gcacgtctgt gatgtgccta 300 
catatgcgtg tctatggcat gggtgtgtgt 360 
ggcatggtcc gcaccatcgt cctcacgctc 420 
agggccctca cttctagcat gggtgcccct 480 
gtaagccagg tttgagagga gagtagggat 540 
ccccaggacc ccagtctggc ctatgccggc 600 
ctcgcccccc gggacacact ccccccagag 660 
gaaaggggcc ctgggcttgg gttcccaccc 720 
cctcaaagtc gtgccaggcc ggggtgcaga 780 
ggggagaggc acatgtggaa acccacaagg 840 

865 



<210> 10 
<211> 3782 
<212> DNA 

<213> Homo sapiens 



<400> 10 

tgtgggattg gtcttcatgt gtgggatagg tggggatctg tgggattggt ttttatgagt 60 
ggggtaacac agagttcaag gcgagctccc ttcctgtagt gggtctgcag gtgctccaac 120 



WO 99/33998 



PCT/EP98/08216 



11 / 18 



agctttattg aggagaccat atcttccttt gaactatggt cgggtttata gtaagccagg 180 
ggtgcggagg cctcccctgg gctccctgtt ctgtttcttc cactctgggg tcgtgcggtg 240 
cctgctgtgg tgtgtggccg gtgggcaggg ctcccaggcc tecttgtgtt cattggcctg 3 00 
gatgtggccc tggctacgct ccgtccttgg aattcccctg cgagttggag gctttctttc 360 
5 tttctttttt tctttctttt tttttttttt tgataacaga gtctcgctct tttttgccca 420 

ggctggagtg gtttggcgtg atcttggctc actgcaacct gtgcttcctg agttcaagca 480 
attctcttgc ctcagcctcc caagtagctg gaattatagg cgcccaccac catgctgact S40 
aatttttgta attttagtag agacgaggtt tctccatgtt ggccaggctg gtctcgaact 600 
cctgacccca ggtgatcctc ccacctcggc ctcccaaagt gctgggatga caggtgtgaa 660 

10 ccgccgcgcc cggccgagac tcgcttcctg cagcttccgt gagatctgca gcgatagctg 720 

cctgcagcct tggtgctgac aacctccgtt ttccttctcc aggtctcgct aggggtcttt 780 
ccatttcatg actctcttca cagaagagtt tcacgtgtgc tgatttcccg gctgtttcct 840 
gcgtaaccgg tgtctgctgt ttatcgatgg cccccctcca tttcctttag gctttgttta 900 
ttgttgtttt tccggctcct tgaaggaaaa gtttcgatta tggatgtttg aactttcttt 960 

15 tctaaacaag catctgaagt tgccgttttc cctctaaagc agggatcccg aggcccctgg 1020 

ccgtggagcg gcaccggtct ggggcctgtt aggaacccgg cgcacagcgg gaggctaggt 1080 
ggggtgtggg gagccagcgt tcccgcctga gccccgcccc tctcagatca gcagtggcat 1140 
gcggtgctca gaggcgcaca caccctactg agaaccgtgc gtgagagggg tctagattct 1200 
gtgctcctta tgggaatcta atgcctgatg atccgaggtg gaaccgtttg cccccaaaac 1260 

20 catccccttc cccactgctg tcctgtggaa aaaccgtctc ccacgaaacc agcccctggt 1320 

accacaacgg ttggggacce tgtgctaaag acctgctcca gcagcctctc gtcagtgttg 1380 
atatattggc ctctctgtgc tgagtccaga ataattacgg acccccgcga tgcttcccgc 1440 
cgacctcaga cccatgggct atttgtgggc gtgttgcctg ctcctgggtt gggaagggcg 1500 
caggccccat gtaccttcct gccaccgccc cccaggttgg ctcccagggt tgaatcgtac 1560 

25 tcgatgtggc ttcagcccac ggccctgccg ccagctcctg ggggctgggg aacatgctga 1620 

agcacagagt caccgtgcgc gtcttttgat gccccacaag ctcgaggcct cctgtgtccg 1680 
tgttagtgtg tgtcacgtgc ctgcccacat cccgccttgg ggacgcaggg gcttagcagg 1740 
tcecgtagta aatgacaagc gtcctggggg agtccgcaga acaggaggtg ggggtgccgg 1800 
tctctctccc gcgtcctcag actcttctcc tgcctgtgcc gtggctgcac ctgcatcccc 1860 

30 gcaatccctc cagcaccggg ctggagaggc ccgggagccc gagcgccacc cgtgccacgc 1920 

gaccgcggat ggcagtcggt cacgggggtc tgatgtgtgg tgactgtgga tggcggttgg 1980 
tcacaggggt ccgatgtgtg gtgactgtgg acggcggtcg cggggtctga tgtggtgact 2040 
gcggacggcg gtcgtggggt ctgatgtgtg gtgactgtgg atggcggtcg cggggtctga 2100 
tgtggtgact gtggatggcg gtcgtggggt ctgatgtggt gactgtggat ggcggtcgtg 2160 

35 gggtctgatg tggtgactgt ggatggcagt cgtggggtct gatgtgtggt gactgtggat 2220 

ggcggtcgtg gggtctgatg tggtgactgt ggatggcagt cgtggggtct gatgtgtggt 2280 
gactgtggat ggcggtcgtg gggtctgatg tgtggtgact gtggatggcg gtcgtggggt 234 0 
ctgatgtgtg gtgactgtgg atggcggtcg tggggtctga tgtgtggtga ctgtggatgg 2400 
cggtcgtggg gtctgatgtg gtgactgtgg atggcggtcg tggggtctga tgtgtggtga 2460 

40 ctgtggatgg tgatcggtca caggggtctg atgtgtggtg actgtggatg gcggtcgtgg 2520 

ggtctgatgt gtggtgactg tggatggtga tcggtcacag gggtctgatg tgtggtgact 2580 
gtggatggcg gtcgtggggt ctgatgtgtg gtgactgtgg atggcggttg gtcccggggg 2640 
tctgatgtgt ggtgactgtg gatggcgatc ggtcacaggg gtctgatgtg tggtgactgt 2700 
ggatggcggt cgtggggtct gatgtgtggt gactgtggat ggcggtcgtg gggtctgatg 2760 

45 tgtggtgact gtggatggcg gtcgtggggt ctgatgtggt gactgtggat ggcggtcgtg 2820 

gggtctgatg tggtgactgt ggatggcggt cgtggggtct gatgtgtggt gactgtggat 2880 
ggcggttggt cccgggggtc tgatgtgtgg tgactgtgga tggcggtcgt ggggtctgat 294 0 
gtggtgactg tggatggcag tcgtggggtc tgatgtgtgg tgactgtgga tggcggtcgt 3000 
ggggtctgat gtgtggtgac tgtggatggc ggtcgtgggg tctgatgtgt ggtgactgtg 3060 

50 gatggcggtc gtggggtctg atgtgtggtg actgtggatg gcggtcgtgg ggtctgatgt 3120 

ggtgactgtg gatggcggtc gtggggtctg atgtgtggtg actgtggatg gtgatcggtc 3180 
acaggggtct gatgtgtggt gactgtggat ggcggtcgtg gggtctgatg tgtggtgact 3240 
gtggatggcg gtcgtggggt ctgatgtggt gactgtggat ggcggtcgtg gggtctgatg 3300 
tgtggtgact gtggatggcg gtcgtagggt ctgatgtgtg gtgactgtgg atggcagtcg 3360 

55 gtcacagggg tctgatgtgt ggtgactgtg gatggcggtc gtggggtctg atgtgtggtg 3420 

actgtggatg gcggtcgtgg ggtctgatgt gtggtgactg tggatggcgg tcgtggggtc 3480 
tgatgtgtgg tgactgtgga tggcggtcgt ggggtctgat gtggtgactg tggatggtga 3540 
tcggtcacag gggtctgatg tgtggtagct gcaggtggag tcccaggtgt gtctgtagct 3600 
actttgcgtc ctcggccccc cggcccccgt ttcccaaaca gaagcttccc aggcgctctc 3660 

60 tgggcttcat cccgccatcg ggcttggccg caggtccaca cgtcctgatc ggaagaaaca 3720 

agtgcccagc tctggccggg gcaggccaca tttgtggctc atgccctctc ctctgccggc 3780 
ag 3782 
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<210> IX 
<211> 980 
<212> DMA 

<213> Homo sapiens 
<400> 11 

gtctgggcac tgccctgcag ggttgggcac ggactcccag cagtgggtcc tcccctgggc 60 
aatcactggg ctcatgaccg gacagactgt tggccctggg gggcagtggg gggaatgagc 120 
tgtgatgggg gcatgatgag ctgtgtgcct tggcgaaatc tgagctgggc catgccaggc 180 
tgcgacagct gctgcattca ggcacctgct cacgcttgac tgcgcggcct ctctccagct 24 0 
ccgcagtgcc tttgttcatg atttgctaaa tgtcttctce gccagcttcg atcttgaggc 300 
caaaggaaag gtgtccccct cctttaggag ggcaggccac gcctgagccg tgtcctgccc 360 
agctggcccc tcagtgccgg gtccgaggcc aaaggaaacg tgtccccctt cttaggagga 420 
cgggccgcgt tcgagccacg ccccgctgag cgggcctctc agtgctgggc ctgtccacgt 480 
ggccctgtgg ccctttgcag atgtggtctg tccacgtggc cctgtggctc tccgcagatg 54 0 
cctgttagca cttgctcggc tctaggggac agtcgtgtcc accgcacgag gctcagagac 600 
ctctgggcga atttccttgg ctcccagggt gggggtggag gtggcctggg ccgctgggac 660 
ccagaccctg tgcccggcag ctgggcagca actcctggat cacatatgcc acccgggcca 720 
cggtgggctg tgtgggtgtg agcccagctg gacccacagg tggcccagag gagacgttct 780 
gtgtcacaca ctctgcctaa gcccatgtgt gtctgcagag actcggcccg gccagcccac 840 
gatggccctg cattccagcc cagccccgca cttcatcaca aacactgacc ccaaaaggga 900 
cggagggtct tggccacgtg gccctgcctg ccccagcacc caccggccca ctcccatgtg 960 
tctcccgtct gctttcgcag 980 

<210> 12 
<211> 2485 
<212> DNA 

<213> Homo sapiens 
<400> 12 

gcgagccagg tggccaggtg ccattgccct gcgggtggct gggcgggccg gcagggcttc 60 
tgctcacccc tctcccgccc cttccccact gnccttctgc ccggggccac cagagtctcc 120 
tttcctggcc cccgcccccc ccggctcctg ggctgcaggc tcccgaggcc ccggaaacac 180 
ggctcggcct gcggcagccg gagcggagca ggtgccacac gaggcctgga aatggcaagc 24 0 
ggggtgtgga gttgctcctg cgcggaggac gaggggcggg gggtgtgtct gggtcaggtg 300 
tgcgccgagc gtttgagcct gcagcttgtc agctccaagt tactactgac gccggacacc 360 
cggccctcac acgcttgtat ctctctcccc cgatacaaaa ggactttacc cgattctcat 420 
tcctgtccct gtcgtgtgac ccccgcgagg gcgcgggctc ttctctctgt gactagattt 480 
cccatctgga aagtgcgggg ttgaccgtgt agtttgctcc tctcgggggg cctgtggtgg S4 0 
ccatggggca ggcggcctgg gagagctgcc gccacacagc cactgggtga gccacactca 600 
cggcggcaga gccacagtgc ctggtgccac atcacgtcct ctggatttta agtaaaacca 660 
cacacctccc ggcaggcatc tgcctgcgac cctgtgtgtg cctggggaga gcggtagcac 720 
ggaggaaatt cgtgcacact caaggtcatc agcaaggtca tccgcagtca ggtggaacgt 780 
ggaggcctct ctctgggatc gtctccagcg gacaaaggac cgtgcacagc ttcggaagcc 840 
tttatteaaa aatataacta ttaattattg cattataagt aatcactaat ggtatcagca 900 
attataatat ttattaaagt ataattagaa atattaagta gtacacacgt cctggaaaaa 960 
cacaaattgc acatggcagc agagtgaatt ttggccgagg gacacgtgtg cacatgtgtg 1020 
caagcggccc ccaggcccac agaattcgct gacaaagcca cccccccaga gaagccacca 1080 
cgggcctcct tcgtggtcgt gaattttatt aagatggatc aagccacgca ccgtccacgt 1140 
gtggcagggc cttggggaat gcgaggtgat gactgcgtcc tcatgccctg acagacagga 1200 
ggcgactgtg tctgtcctgt ccctaggaca cggacaggcc cgaagctcta gtccccatcg 1260 
tggtccagtt tggcctctga ataaaaacgc cttcaaaacc tgttgcccca aaaactaaga 1320 
acagagagag tttcccatcc catgtgctca caggggcgta tctgcttgcg ttgactcgct 13B0 
gggctggccg gactcctaga gttggtgcgt gcgcttctgt gcaaaaagtg cagtcctctt 1440 
gcccatcact gtgatatctg caccagcaag gaaagcctct tttctctcct ttcttttttt 1500 
ttttttgaga cggaacgeca ctgttgtctg cctgggctcg agtgcagtgg cgcgatctca 1560 
actcactgca acctccgcct cccgggttcc agcatttctc ctgcctcagc cccccgagca 1620 
gctgagatta caggcaccca ccccctgcgc ctggctaatt tttgtatttt tagtagagag 1680 
gggctcctgc cacgttggcc aggccggtct cgaactcccg acctcaggtg acccacccac 1740 
ctcggcctcc caaagtgctg ggattacagg tgtgagccat cacgcccagc cggaaagcct 1800 
ctttctaagg cgaccaccta tagcgcttcc cgaaaataac aggtcttgtc tttgcagtag 1860 
gctgcaagcg cctcctagca acaggagtgg cgtcctgcgg gctctgggga tggctgaggg 1920 
ccgcgtggca gccatgcctc ctgtgtgcac ccttaggttc cacggggcca ttctgctctc 1980 
actgtttgcc tgaaaacgca cccttggcat cctcgtttgg agagttcccg cttctcgttg 2040 
gtcatgctga aactaggggc aaggttgtat ccgtcggcgc gcagcggcca catgtagggt 2100 
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catgagtcxt tcaccgtgga caaattcctt gaaaaaaaaa aaaggagtcc ggttaagcat 2160 

tcattccggg tcaagtgtct ggttctgtga ataaactcta agatttaaga aaccttaatg 2220 

aaagaaaacc ttgatgattc agagcaagga tgtggtcaca cctgtggctg gatctgtttc 2280 

agccgcccca gtgcatggtg agagtgggga gcagggattg ttcgctcaga ggtctcatct 234 0 

ggtatgtctc cgaggtgttt gccggctgaa tggtagacgt gtcgtctgtg tgtatgaggt 2400 

tctgtgtctg tgtgtggctc ggtttgagcg tacgcatgtc cagcacatgc cctgcccgtc 2460 

tctcacctgt gtcttcccgc cccag 24S5 

<210> 13 

<211> 1984 

<212> DNA 

<213> Homo sapiens 



<400> 13 

15 gtgaggcctc ctcttcccca ggggggcttg ggtgggggtt gatttgcttc tgatgcattc 60 

agtgttaata ctcctggtgc tccggagacc atgactgctc tgtcttgagg aaccagacaa 120 
ggttgcagcc ccttcttggt atgaagccgc acgggagggg ttgcacagcc tgaggactgc 180 
gggctccacg caggctctgt ccagcggcca tgtccagagg cctcagggcc cagcaggcgg 240 
gagggccgcc gccccgcatg atgagcacgt gaattcaaca ccgaggaagc acaccagctt 300 

20 ccgtcacgcc acccaggttc cgttagggtc cttggggaga tggggccggt gcagcctgag 360 

gccccacacc tcccagcagg ccctcgacag gtggcctgga ctgggcgcct cttcagccca 420 
ctgcccatcc cacctgcacg gggtccacac ccaaggacgc acacacctaa ataccgtgcc 480 
aacctaatgt ggttcaactc agctggcttt cactgacagc agttactttt ttttttttaa 540 
tactctaagt tctagggtac atgtgcacga cgtgcaggtt agttacatat gtatacatgt 600 

25 gccatgttgg tgtgctgcac ccattaaccc atcatttaca ctaggtatat ctcctaacgc 660 

tatccccccc cactcccccc atcccacgac aggccctggt gtgtgatgtt ccccaccctg 720 
tgtccaagcg ttctcattgc tcagttccca cccgcgagtg agaacatgcg gcgtttggct 780 
ttcttcccct gcaatagttt gctcagagtg atggtttcca gcttcgtcca tgtccctaca 840 
aaggacatga acccatcctt ttttatgact gcatagtatt ccgtggtgta tatgtgccac 900 

30 attttcttaa tccagtctat catcgatgga catttgggtt ggttgcaagt ctttgctact 960 

gtgaatagtg ccgcaataaa catacgcgtg catgtgtctt tatagcagca tgatttataa 1020 
tcctttgggt atatacccag taatgggatg gctgggtcaa atggtatttc tagttctaga 1080 
tccttgagga atcaccacac tgtcttccac aacggttgaa ctagtttaca ctcccaccaa 1140 
cagtgtaaaa gtgttctggt gccggagagg atgtggacag cagttatttt tttatgaaaa 1200 

35 cagtatcacc gaacaagcag acagttagtg aaggatgcgt caggaagcct gcaggccaca 1260 

cagccatttc tctcgaagac tccgggtttt tcctgtgcat cttttgaaac tccagctcca 1320 
attatagcat gtacagtgga tcaaggttct ccttcactaa ggttcaagtc ctagatcgaa 13 80 
ataagtttat gtaacagaaa caaaaatttc ttgtacacac aacttgctct gggatttgga 1440 
ggaaagtgtc cccgagctgg cggcacactg gtcagccctc tgggacagga tacctctggc IS 00 

40 ccatggtcat ggggcgctgg gcttgggccc gagggtcaca cagtgcacca tgcccagctt 1560 

cctgtggata ggatctgggt ctcggatcat gctgaggacc acagctgcca tgctggtaaa 1620 
gggcaccacg tggctcagag ggggcgaggc tcccagcccc agctttctca ccgtcttcag 1680 
tcatttttcc ctaagagtct gagaagtggg gccgcgcctg acggccttcg ttcgtcttca 1740 
gctggcacag aattgcacaa gctgatggta aacactgagt acttataatg aatgaggaat 1800 

45 tgctgtagca gttaactgta gagagcccgt ctgttggaaa gaaacttaag tttttcattt 1860 

aaccgctttg gagaatgtta ctttatttat ggctgtgtaa attgtttgac attcagtccc 1920 
tcgtagacag atactacgta aaaagtgtaa agetaacctt gctgtgtact ttcccttatt 1980 
ttag 1984 

50 <210> 14 

<211> 1871 

<212> DNA 

<213> Homo sapiens 

55 <400> 14 

gtgaggcccg tgccgtgtgt ctgtggggac ctccacagcc tgtgggcttt gcagttgagc 60 
cccccgtgtc ctgcccctgg caccgcagcg ttgtctctgc caagtcctct ctctctgccg 120 
gtgctggatc cgcaagagca gaggcgcttg gccgtgcacc caggcctggg ggcgcagggg 180 
cacctccggg agggagtggg taccgtgcag gccctggtcc tgcagagacg cacccaggtt 24 0 

60 acacacgtgg tgagtgcagg cggtgacctg gctcccgctg ctctttggaa agtcaagagt 300 

ggcggctcct ggggccccag tgagaccccc aggagccgtg cacagggccc gcagggccga 360 
ggcggcagcc ccctccccag ggcgcacctg agcctgcgga gagcaggagc tgctgagtga 420 
gctggcccac agcgttcgct gcggtcacgt tcccgcgtgg ggctgcttgg gatcggtggg 4 80 
agaattcgga tttgctgagt gctgctgtct cgaaccacgg agatggctag gagcgggttt 540 

65 cagagctgat tcttgtgaat caaactaaaa tcaggcacag gggacctggc ctcagcacag 6 00 
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gggaccgtcc aatgtggtcc ccctcaaggg cgccccacag agccggtggg cttgttttaa 660 
agtgcgactt gacgagggac gagaaacccc gaaagccgta aagggaaccc tcagaaaatg 720 
tggccgccag gggtggtttc aggtgctttg ctgggctgcg tttgtgaaaa cccatttgga 780 
cccgcccccc aagcccaccc cccaggccca ccctccaggg ccgccctggg ctgggggtat 840 
gcctggcgcc ccttgtgccg cagcccggag cacagcaggc tgtgcacatt taaatccact 900 
aagattcact cggggggagc ccaggtccca agcaaccgag ggctcaggag tcctgaggct 960 
gctgagggga cagagcagac ggggaacgct gcttctgtgt ggcaagttcc cgagggtgct 1020 
ggccagggag gtggctcaga gtgtatgttg gggtcccacc gggggcagaa ctctgtetct 1080 
gatgagtcgg cagccatgta acaggaaggg gtggccacag ggagctggga atgcaccagg 1140 
ggagctgcgc agctggccga ggtcccaggg ccaggccaca ggaagggcag ggggacgccc 1200 
ggggccacag cagaggccgc aggaagggaa ggggacgccc aggccagagc agaggccacc 1260 
gggcacaggg gggctccccg agctgggtga gcgaggctca tgactcggcg agggaacctc 1320 
cttgacgtga agctgacgac tggtgttgcc cagctcacag cccagccagg tcccgcgcct 1380 
gagcaggaac tcagaaccct cccctttgtc taaagcacag cagatgccct cagggcatct 144 0 
aggagaaaac aggcaaagtc gttgagaaac gtcttaaaag aaggtgggat ggtggcaatt 1500 
tcttgcccag attttagtct gccccggacc acagatgagt ctataacggg attgtggtgt 1560 
tgccacgggg acacatgaga tggaccatca cagaggccac tggggctgca cctcccatct 1620 
gagtcctggc tgtcccgggt ccaggccagg ttcttgcatg ctcacctacc tgtcctgccc 1680 
gggagacagg gaaagcaccc cgaagtctgg agcagggctg ggtccaggcc cctcagagct 1740 
cctgccaggc ccagcaccct gctccaaatc accacttctc tggggttttc caaagcattt 1800 
aacaagggtg tcaggttacc tcctgggtga cggccccgca tcctggggcc gacattgccc 1860 
ccctgcctta g 1871 

<210> IS 

<211> 3801 

<212> DNA 

<213> Homo sapiens 

<400> 15 

gtgagcgcac ctggccggaa gtggagcctg tgcccggctg gggcaggtgc tgctgcaggg 60 
ccgttgcgtc cacctctgct cccgtgtggg gcaggcgact gccaatccca aagggtcaga 120 
ggccacaggg tgcccctcgc cccatctggg gctgagcaga aatgcatctt tctgtgggag 180 
tgagggtgct cacaacggga gcagttttct gtgctatttt ggtaaaagga aatggtgcac 24 0 
cagacccggg tgcactgagg tgtcttcaga aagcagcccg gatccgaacc caagacgccc 300 
gggccctgct gggcgtgagc ctctcaaacc cgaacacagg ggccctgctg ggcatgagcc 360 
cctctgaacc cgagaccctg gggccctgct gggcgtgagt ctctccgaac ccagagactt 420 
cagggccctt ttgggcgtga gtctctccgc tgtgagcccc acactccaag gctcatccac 4 80 
agtctacagg acgccatgag ttcatgatca cgtgtgaccc atcaggggac agggccatgg S4 0 
tgtggggggg gtctctacaa aattctgggg tcttgtttcc ccagagcccg agagctcaag 600 
gccccgcctc aggctcagac acaaatgaat tgaagatgga cacagatgca gaaatctgtg 660 
ctgtctctct cacgaataaa aagtaccaac attccaggca gggcaaggtg gctcacacct 720 
ataatcccag cactttggga ggccgaggtg ggtggaccac ttgaggccag gagtttgagg 780 
ccaacctaac caacatagtg aaattccatt tctacttaaa aaatacaaaa atcagcctgg 84 0 
cctggtggca cacgcctgta gtccccgcta tgcgggaggc tgaggcagga gaatcatttg 900 
aacccaggag gcagaggttg cagtgagccg agaccacacc actgcactcc agcctgggca 960 
acagagtgag ac tt caret t aaaaaaaaaa aaaaaagtat cagcattcca aaaccatagt 1020 
ggacaggtgt ttttttattc tgtccttcga taatatttac tggtgctgtg etagaggecg 10 80 
gaactggggg tgccttcctc tgaaaggcac accttcatgg gaagagaaat aagtggtgaa 1140 
tggttgtcaa accagaggtt taaactgggg tcctgtcgtt ctgagttaac agcccagatc 1200 
tggactttgc ctctttccag aatgctcccc ggggtttgct tcatggggga gcagcaggtg 1260 
tggacaccct cgtgatgggg gagcagcagg tgcagacgcc ctcatgatgg gggagtggca 1320 
ggtgcagaca cccttgtgca tggtgcccag catgtccctg ttgcagctcc ctccccacaa 1380 
ggatgccggt ctcctgtgct ccccacagtc cctgcttccc tctcacagcc ttacctggtc 1440 
ctggcctcca ctggctttgt ctgeatgatt tccacatttc ctgggctccc agcacctctt 1500 
cgcctctccc aggcacctct gcagtgctgg ccataccagt cagctgtgaa ctgtccactg 1560 
ettattttge tccccatgaa atgtattttt taggacaggc acccctggtt ccagcctctg 1620 
gcacagcatc agtgaatgtt atcgaaggac aaaggacaga caaacaaatc aggaaaatgg 1680 
gttctctcta aacacattgc aaagccacag aggctagtgc aggatgggtg ggcatcaggt 174 0 
catcagatgt gggtccaatg ccagaatatt ctgtgctccc aaaggecact tggtcagagt 1800 
gtgtgcttgc agaggtggct ctaaaagctc agcagtggag gcagtggttc gccatactca 1860 
gggtgaactc acatcctctg tgtctgaagt atacagcaga ggcttgaagg gcatctggga 1920 
gaagaaaaca ggcaaaatga ttaagaaaag tgaaaaagga aaagtggtaa gatgggaatt 1980 
tccttgtcca gattttagtc tcccaaacca cagctcagat ggtagaacgt ggtcagaacc 204 0 
gatggacaga acaatagaac aaaacggaag ccctacctct cagaaaegtg tgttaatgtg 2100 
gcatgtggca cagctgatgg aaaagagagt gtgtgtgtaa tttttttttc tgagaaaact 2160 
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gactggaagc aaataagttg tgtctetaca 
aggagacaca tgcaaacaac accagcaaca 
aggtgaacgt tccctggttt ggtgttgggg 
tgaggcaacg ggcattgctt tcactgcaga 
aeggccattc cctggagcgt ttgtgcacgt 
cacattcatc ctctcacttt gtcctcctaa 
aggggagcag ccgcccttgg tcacccagct 
ctcctgctcc ggggcccttg ctctgcccga 
agggtgagcc ggagcccaag gtcgtgttgg 
gacgcacact tgggaaggtc ctaccagcag 
gagacccatc cctcaaagaa acgcacgtga 
atgctggctc cttttctggg ctcgccaaga 
acctttctgg aaagcagctt gtttgcatgg 
taattccact tctgaagtga ccagacatta 
ccaggcaggg ggacttgcca cagcaagtca 
tattatgcat cacaaaactt gctctgccat 
gtttaatggc acaaaacgtt tatttcaatg 
cacaccccag gagcctgccg tgaatgtcac 
gggcagtgag tggtggtgag gccctggagg 
ctggagacac catgtgtgcc acgtgcactc 
gctcttccat ccctgagatt caaacacagc 
ccacaaaaaa cctgagtcac acctgtgttc 
acagtttatt atgtgttttt ggctgagtta 
tgcacaaaca cggccgtgcg aggtttggat 
gagtttggtc atgcagagtc tggatggcat 
cagccccctc gggctgcagc gcatgcccca 
aggctctttg gagcaagcct tgcaggaggg 
acactccccc ctgtgtctca g 



gcatatacca gagcagactc taggtagaag 2220 
gaaataaaac aaaagactca aagggaaggg 2280 
aaggacacac agggaggcgg atgaaaccag 2340 
gaaactcagc ttgcctgagc cacagcgaaa 2400 
gatttattca aggcgccctg tgaggtcctg 2460 
ccacctgaga ggtagaggag gaaaggctcc 2S20 
ggcaaagggc atgcatgatt gcagcctggc 2S80 
ggaccccaca caagtcagac ccataggctc 2640 
ggatggctgt gaaagaagaa atggacgtct 2700 
cgtcaaagaa atgcatgtga aactgacagc 2760 
aactgatggc gagacccgtc cccatccctc 2820 
gccagcatca ggttgaggca agccggaaag 2880 
aagtcctcac aatgtcctgt gtcttcccag 2940 
tcacgggccc tatttaccat ttccagtgtt 3000 
cgaacctgcc caaacacagg gctaaggaga 3060 
taaacatttt tcaaagaatt cttgaagaat 3120 
tagcagtgtt caaagctgga tgtaaaagaa 3180 
gtgtgttcat ctttggacat ggacatacat 3240 
acatcggtgg gatgcctcca ccccgcccct 3300 
accggagccc cgctcagctg gcgccacccg 3360 
gagactcccc acgcccaact cagtgctctc 3420 
actcgaggga cgcccgggag ccagggcccc 3480 
cgtgcagacc ccaccagggc agatgatgag 354 0 
acactcaaca tcactagcca ggtcctggtg 3600 
gtagcactcg gagtccatgg agtgagcacc 3660 
ggcaggacaa ggaagcggga ggaaggcagg 3720 
ggctgggtgc ggggcaggca cctgtgtctg 3780 

3801 



<210> 16 

<211> 880 

<212> DNA 

<213> Homo sapiens 



<400> 16 

gcgagcaggc cgatggccag cacagagttc 
gtgtgtgtgt gtgcgcgcgt gcctgcaagg 
acacgtacgc acatacacgt gagcacatac 
cagtgtgcgc acaggtgtgc aagggcacaa 
cgcatgtgtg ttcgtgcaca gtcgtgtggg 
gcagcgcgag tagcatgcgt gcacacaaca 
caggtcccca gcaccagtgc cactccttac 
gctgaggctc tgaagctgca gccccgaggg 
ccctctcctg tgggcttctg cgtccactcc 
actccctccc tcctgtgggc atccgcgtcc 
cctcccctct ctgtgggcat ttgcgtccac 
gagcctcggg ggcaggcaga tgacacagag 
ccgggtgagg gccaggccgg atttcaccgg 
ctctttcttg ctccatccga acggatgata 
gaggtttcta ccgcttctca ctctttcttg 



agagttcagg aggtgtgtgc gcaagtatgt 60 
ctgatggtga ctggctgcac gtaagagtgc 120 
atgtgtgcat gtgtgtacat gaaggcatgg 180 
gtgtgtgcac atgcgaatgc acacctgaca 240 
cattcacgtg aggtgcatgc gtgtgggtgt 300 
tgtattgagg ggtcctcgtg ttcaccccgc 360 
aggatgagac ggggtcccag gccttggtgg 420 
cattgtccca tctgggcatc cgcgtccact 480 
ccctctcctg tgggcatcta catccactcc 540 
actccccctc tctgtgggca tctgcgtcca 600 
tccctctcct ggttccttcc tgtcttggcc 660 
tcttgactcg cccagggtgg ttcgcagctg 720 
gaagagggat agtttcttgt caaaatgttc 780 
aagcaaaaag taaaaactta aaatcccaga 840 
gcgactctag 880 



<210> 17 

<211> 3186 

<212> DNA 

<213> Homo sapiens 

<400> 17 

gtgagccgcc accaaggggt gcaggcccag 

tctgacccgg ggcttcacct tggaactcct 

ttcagtggtg ctgctgcctg tgcacagttc 

tctccatctc tgggtagtgg taggagccgg 

gcactggccg tgggacgtca tggaggccat 

atgtttatgg ggagtcttag cagaggaggc 

tcagatgccc ggaggatttg gggtctcagc 
tcgctggccc cacccccggg aaggtgcagc 



cctccaggga ccctccgcgc tctgctcacc 60 
gggctttagg ggcaaggaat gtcttacgtt 120 
tgttcgcgtg gctctgtgca aagcacctgt 180 
tgtggcccca ggtgtcccca ctgtgcctgt 240 
cccagggcag caggggcatg gggtaaagag 300 
tgggaaggtg tctgaacagt agatgggaga 360 
aaagagggcc gaggtgggtg caggtgaggg 420 
agagctgtgg ctccccacac agcccggcca 4 80 
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gcacctgtgc tctgggcatg gctgtgctcc tggaacgttc cctgtcctgg ctggtcaggg 540 
ggtgcccctg ccaagaatcg acaaccttac cacagaggga agggccaatc tgtggaggcc 600 
acagggccag cttctgcctg gagtcagggc aggtggtggc acaagcctcg gggctgtacc 660 
aaagggcagt cgggcaccac aggcccgggc ctccacctca acaggcctcc cgagccactg 720 
5 ggagctgaat gccaggaggc cgaagccctc gccccatgag ggccgagaag gagtgtgagc 780 

atctgcgtta cccagggccg aggctgcgcg aattaccgtg cacacttgat gtgaaatgag 840 
gtcgtcgcct atcgtggaaa cccagcaagg gctcacggga gagttttcca ttacaaggtc 900 
gtaccatgaa aacggcttct aacccgagtg cttgcgcctt catgctctgg cagggagggc 960 
agagccacag ctgcatgtta ccgcccttgc accagctcca gaggcttggg accaggctgt 1020 

10 cccagttcca gggtgcgtcc ggcccagacc gccctcctct ctgccttctc tctctgcctc 1080 

aaatcctccc tcgtttgcat ctccctgacg cgtgcctggg ccctcgtgca agccgcttga 114 0 
ctcccttccg gaaaccctcg gggtgtgctg gatacaggtg ccactgagga ccggaggtgt 1200 
ctgacactgt ggctgacccc agggtccagc tggcgtgcct ggggcctcct tgggccacga 1260 
tgaggtcaga ggagttttcc caggtgaaaa ctcctgggaa acccccaggg ccatgtgacc 1320 

15 tgccacctgc tcctcccata ttcagctcag tcttgtcctc atttccccac cagggtctct 1380 

agctccgagg agctcccgta gagggcctgg gctcagggca gggcggccga gtttccccac 1440 
ccatgtgggg acccttgggt agccgcttga ttgggtagcc ctgaggaggc cgagatgcga 1500 
tgggccacgg gccgtttcca aacacagagt caggcacgtg gaaggcccag gaatcccctt 1S60 
ccctcgaggc aggagtggga gaacggagag ctgggccccg atttcacggc agccaggctg 1620 

20 cagtgggcga ggctgtggtg gtccacgtgg cgctgggggc ggggtctgat tcaaatccgc 1680 

cggggctcgg ccttcctggc ccgtgctggc cgcgcctcca cacgggcttg gggtggacgc 1740 
cccgacctct agcaggtggc tatttccccc tttggaagag agcccctcac ccatgctagg 1800 
tgtttccctc ctgggtcagg agcgtggccg tgtggcaacc ccgggacctt aggcctattt 1860 
atttgtttaa aaacattctg ggcctggctt ccgttgttgc. taaatgggga aaagacatcc 1920 

25 caccccagca gagttactga gaggctgaaa ccggggtgct ggcctgactg gtgtgatctc 1980 

agg teat tec agaagtggct caggaagtca gtgagaccag gtacatgggg ggcccaggca 2040 
gtgggtgaga tgaggtacac ggggggctca ggcagtgggt gaggecaggt acatgggggg 2100 
ctcaggcact gggtgagatg aggtacaegg ggggctcagg cagagggtca gaccaggtac 2160 
aegggggetc tgatcacacg cacatatgag cacatgtgca catgtgctgt ttcatggtag 2220 

30 ccaggtctgt gcacacctgc cccaaagtcc caggaagctg agaggecaaa gatggaggct 2280 

gacagggctg gcgcggtggc tcacacctgt agtcccagca ctttgggagg ccgaggegag 2340 
aggatccctt gageccagga gtttaagacc agectgagea acatagtaga accccatctc 2400 
tatgaaaaat aaaaacaaaa attagctgaa catggtggtg tgcgcctgta gttccaatac 2460 
ttgggaggct gaagtgggag gatcacttga geccaggagg tggaagctgc agtgagctga 2S20 

35 gattgeacca ctgtactgca gcctgggtga cagagtgaga gcccatctca acaacaacaa 2S80 

agaagactga caaatgeagt ttcttggaaa gaaacatcta gtaggaactt aacctacaca 264 0 
cagaagecaa gtcggtgtct cggtgtcagt gagatgagat gatgggtcct cacaccatca 2700 
ccccagaccc agggtttatg caccacaggg gcgggtggct cagaagggat gcgcaggacg 2760 
ttgatatacg atgacatcaa ggttgtctga cgaagggcag gattcatgat aagtacctgc 2820 

40 eggtacacaa ggaacaatgg ataaactgga aaccttagag gccttcccgg aacaggggct 28 80 

aatcagaagc cagcatgggg ggccggcatc caggaeggag ccgcttcagc ctccacatgc 294 0 
gcgttcatac agatggtgca cagaaacgea gtgtacctgt gcacacacag acacgcagct 3000 
actcgcacac acaagcacac acacagacat geatgeatge atccgtgtgt gtgcacctgt 3 060 
geccatgagg aaacccatgc atgtgcattc atgcacgcac acaggcaccg gtgggcccat 3120 

45 gcccacaccc acgagcaccg tctgattagg aggcctttcc tetgaegctg tccgccatcc 3180 

tctcag 3186 

<210> 18 
<211> 781 
50 <212> DNA 

<213> Homo sapiens 

<400> 18 

gtatgtgcag gtgcctggcc tcagtggcag cagtgcctgc ctgctggtgt tagtgtgtca 60 
55 ggagactgag tgaatctggg cttaggaagt tcttaccccc ttccgcatca ggaagtggct 120 

taacccaacc actgtcaggc tcgtctgccc gccctctcgc ggggtgagca gagcacctga 180 
tggaagggac aggagctgtc tgggagctgc catccttccc accttgctct gcctggggaa 240 
gcgctggggg gcctggtctc tcctgtttgc cccatggtgg gatttggggg gcctggcctc 300 
tcctgtttgc cctgtggtgg gattgggctg cctcccgtcc atggcactta gggcccttgt 3 60 
60 gcaaacccag gecaaggget taggaggagg ccaggcccag gctaccccac ccctctcagg 420 

ageagaggee gcgtatcacc acgacagagc cccgcgccgt cctctgcttc ccagtcaccg 480 
tcctctgccc ctggacactt tgtccagcat cagggaggtt tetgatcegt ctgaaattca 54 0 
agecatgteg aacctgeggt cctgagccta acagcttcta ctttctgtcc tttctgtgtt 600 
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gcggaaattt cacctggaga agccgaagaa 
gggtcgggac agccagagat ggagccaccc 
gtgtctcctg ggaggggagc tgggctgggc 

g 



aacatttctg tcgtgactcc tgcggcgctt 660 
cgcagaccgt cgggtgtggg cagctttccg 720 
ctgtgactcc tcagcctctg ttttccccca 780 

781 



<210> 19 
<2ll> 536 
<212> DNA 

<213> Homo sapiens 



<400> 19 

gcaagtgtgg gcggaggcca gtgcgggccc 
tgtgtggggc gagcagcctc agatgctgct 
ggggcctgga gccacgctgg cagccctatg 
agcctggcag ggtccccaac ttcttgaacc 
ccacgctcgg gagccttctg acccctgacc 
ccgccctgag ctcctggggt cctgagcaag 
ctgggctgcc tgtctgctcg ccccggtgga 
ccagccaggg ccacgaggtg caggccctgc 
ttggaggatg ccacctctgg cctcttctgg 



cacctgccca ggggtcatcc ttgaacgccc 60 
gaagtgcaga cgcccccggg cctgaccctg 120 
tgactaaacg ctggtgtccc caggccacgg 180 
cctgcttccc atctcagggg cgatggctcc 240 
tgtgtcctct cacagcctct tccctggctg 300 
ttctctcccc gccccgccgc tccagcgtca 3 60 
ggggtgcctg tcccttcact gaggttccca 420 
ctgcccggcc acccacacgt cctaggaggg 480 
aacggagtct gattttggcc ccgcag 536 



<210> 20 

<211> 3179 

c212> DNA 

<213> Homo sapiens 



<400> 20 

atctcatgtt tgaatcctaa tgtgcactgc 
ctgtgagtga acggggtggt ggtcagtgcg 
gtctatgagt gaatggggcc gtggtcagtg 
tttctgatgc tgtgaggcag gaggggaagg 
ccccggaaga cataacagta agtccaggcc 
cttgggcggc ggggatgatg gagggcctgg 
ccggggtggc aggggcgatg gggggggctg 
ggctgggccc cctcctcccc tgcctcccac 
ggcgcacatc ctctgggcca tcagctttca 
cccgcacaaa atccaggatt ccccctcctg 
ccgcctccgg ccactctctt aagagtagac 
gtggggcagt ggagggtgtg gacacaggag 
atcctcttat catctcccag tctcatctct 
tcttcctctt acctcccagc ctcatctgtc 
tatcctctta tctcctagtc ccatccagac 
gcggagctgg acatacgtcc ttcctcaggc 
gaggggcggc tcagagggac gcagtcttgg 
gctcgggcca cacgaaaccg agggccctgc 
cctggtgggg ccttatggta tggccgggtc 
gtttgagtgc agcccggacg tgcctggtgt 
gcgtcattta ttgctgctgc ttcagagaat 
gggcccaagt ccacagactg tgtcgtaaat 
agctgtgagg aaggaggggc tcttggcagc 
ggaagggagc ggccccgggc gccgtgggcg 
agggcgggga cttcccagga gcagaggccg 
gaccaacagg tcaggccatt gttcagctat 
tctccgggtg ttttttgttg aaattttact 
tagaccctta aaaaaggtat ttgctctgat 
ttgtctgttt tcatttatta ttattattat 
ggtcgttagt gcagtggcac agtcatggct 
gatcctccgg cctcagcttc ccagagtgct 
ctggcacttt caaaaaccac tatgtaaggt 
cagcagtttg ggaagccgag gcagaaggat 
gggtaacata gggagacccc atctctacaa 
ccagcatctg tagtcccagc tgctcgggag 
ggtcatggct gcagtgagct gtgattgtac 
gaccctgcct caaaaaaaaa aaaaaaaaaa 
gaaggaaaga gaagaagaag gaagaaggaa 



atagacacca ctgtacgcaa ttacagaagc 60 
ggcccatggc ctggctgtgc atttacggaa 120 
cgggcccatg gcctggccgg gcctgggagg 180 
agggtagggg atagacagtg ggagccccca 240 
cgaagggcag cagggacgct gggggcccag 300 
ccagggcggc agggatgatg ggggccccag 360 
gtctgggtgg cggggaagat ggggaagcct 420 
ctgcagccgc ggatccggat gtgcttccct 480 
tggaggtggg gggcaggggc atgacaccat 540 
aacgccccaa ctcaggttga aagtcacatt 600 
caggattctg atctctgaag ggtgggtagg 660 
gcttcagggt ggggctggtg atgctctctc 720 
catcctctta tcatctccca gtctcatctg 780 
atcctcttac catctcccag tctcatctct 840 
ttacctccca gggcgggtgc caggctcgca 900 
agaaggaact ggaaggattg cagagaacag 960 
ggtgaagaaa cagcccctcc tcagaagctg 1020 
gtgagtggct ccagagcctt ccagcaggtc 1080 
ctactgagtg caccttggac agggcttctg 1140 
cggggtgggg gcttatggcc actggatatg 1200 
gtctgagtga ccgagcctaa tgtgtatggt 1260 
gcactctggt gcctggagcc cccgtatagg 1320 
cggcctgggg gcgcctttgc cctgcaaact 1380 
gacgacctca agtgagaggt tggacagaac 144 0 
ctgctcaggc acacctgggt ttgaatcaca 1500 
ccatcttcta caaagctcca gattcctgtt 1560 
caggattact tatatttttt gctaaagtat 1620 
atggcttaac tcactaagca cctactttat 1680 
tattagagat ggtgtctact ctgtcaccca 1740 
cgctgtagcc gcaaaccccc aggctcaagt 1800 
gggattacag gtgtgagcca ctgcccttgc 1860 
caggtccagt ggcttccaca cctgtcatcc 1920 
tgtctgaggc caggagtttg agaccagcat 1980 
aaaatgcaaa aagttatccg ggcgtggggt 2040 
gctgagtggg aggatcgctt gagcccggga 2100 
catcgcactc cagcctgggc aacagagtga 2160 
gaaggagaag gagaagagaa gaagaaggaa 2220 
gaaagaagga gaaggaggcc tgctaggtgc 2280 
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caggtagacc gtcaaatctc agagcaaaat 

aaccccagct ctttggactt ccctaggccc 

gacaagcgtg tacggagcga gtgagctcaa 

ggaggctgtg ggtga caeca gccaggaccc 

gccccacgct cctgccggtc ctgcacctgc 

acctgggaag gatgctgtgc agggggcttg 

geacttgegg caggcacaat cacagcccct 

acctgtgaat gcgtcacccg caaggcagag 

cgccagtcag ccgatctcaa ggtcatcctg 

gggtccctag aagtgagaga gggaggcagg 

cactggccac tgccggctct gagatggagg 

ccgctccatg ctggaaaagc aagcaatcct 

acgcctcgat ttcaggccag tgggacctgt 

tgatgcgttt gtgttcagcc actaagctgc 
cagtacaggg aaatgaatac agggacagtt 



gaaaataaca aagttttaaa gggaaagaaa 2340 
gaacttcatc ccaagcagct tccttccaca 2400 
agcagaaagg gaggagaagc aggcaagggt 2460 
ctgaaaggga gtggttgttt tcctgcctca 2520 
tgtaaccgtc gatgttggtg ccaggtgccc 2580 
ccaaactttg gtgggttcca gaagccccag 2640 
ccccaaagat gcccacgtcc ttctcctgga 2700 
gctggtgaag getgeaggtg gaatcaegge 2760 
gattatctgg tgggectgat atggccacaa 2820 
ggagagtcag agaggggacg tgagaaggac 2880 
agggggcccc cagecaagga atgggggcag 2940 
ccccggtcct gagggcacac ggccctgccc 3000 
ttcagctttc cggcctccag agctgtaaga 3060 
agtgattcgt cacagcagca aatggaatag 3120 
ctcagagtga ctctcagccc acccctggg 3179 



